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Prefacio 


La respuesta de los estudiantes y profesores a las tres primeras ediciones de Álgebra lineal 
y sus aplicaciones ha sido muy gratificante. Esta cuarta edición brinda un importante apoyo 
tanto para la enseñanza como para el uso de la tecnología en el curso. Al igual que en las 
ediciones anteriores, el libro ofrece una introducción elemental actualizada al álgebra lineal 
y una amplia selección de aplicaciones interesantes. El material es accesible a estudiantes con 
la madurez que se consigue al finalizar de manera exitosa dos semestres de matemáticas de 
nivel universitario, por lo general, de cálculo. 

El objetivo principal del libro es ayudar a los estudiantes a dominar los conceptos básicos 
y las habilidades que usarán más adelante en sus carreras. Los temas expuestos siguen las re- 
comendaciones del Grupo de Estudio del Currículo de Álgebra Lineal, las cuales se basan en 
una cuidadosa investigación de las necesidades reales de los estudiantes y en un consenso entre 
profesionales de muchas disciplinas que utilizan el álgebra lineal. Esperamos que este curso sea 
una de las clases de matemáticas más útiles e interesantes para los estudiantes de licenciatura. 


LO NUEVO EN ESTA EDICIÓN 


El principal objetivo de esta revisión fue actualizar los ejercicios e incluir nuevos contenidos, 
tanto en el libro como en línea. 


1. Más del 25 por ciento de los ejercicios son nuevos o actualizados, en especial los ejer- 
cicios computacionales. Los conjuntos de ejercicios son una de las características más 
importantes de este libro, y estos nuevos ejercicios siguen el mismo estándar elevado de 
los conjuntos de ejercicios de las tres últimas ediciones. Están diseñados de tal forma que 
se refieren a los temas importantes de cada una de las secciones anteriores, y permiten 
que los alumnos desarrollen confianza al motivarlos a practicar y generalizar las nuevas 
ideas que acaban de estudiar. 


2. El 25 por ciento de los ejemplos introductorios de los capítulos son nuevos. Estas in- 
troducciones tienen que ver con aplicaciones de álgebra lineal y despiertan el interés en 
torno al desarrollo del tema que se presenta a continuación. El texto retoma el ejemplo 
introductorio en una sección al final de cada capítulo. 


3. Se incluye un nuevo capítulo, el 8, titulado “Geometría de los espacios vectoriales”, el 
cual presenta un tema novedoso que mis alumnos han disfrutado estudiar. Las seccio- 
nes 1, 2 y 3 ofrecen las herramientas geométricas básicas. La sección 6 utiliza estas ideas 
para estudiar las curvas y superficies de Bézier, las cuales se utilizan en gráficos elabo- 
rados con computadora en el campo de la ingeniería y en línea (en Adobe® Illustrator® 
y Macromedia® FreeHand®). Estas cuatro secciones se pueden cubrir en cuatro o cinco 
sesiones de clase de 50 minutos. 

El segundo curso en las aplicaciones de álgebra lineal suele comenzar con una 
revisión sustancial de las ideas principales del primer curso. Si una parte del capítulo 8 
se encuentra en el primer curso, el segundo podría incluir una breve reseña de las seccio- 
nes 1 a 3 y, luego, un enfoque de la geometría en las secciones 4 y 5. Eso conduciría, 
naturalmente, a los capítulos 9 y 10 que se presentan en línea, los cuales se han utilizado 
junto con el capítulo 8 en varias escuelas en los últimos cinco años. 
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4. Hay dos nuevos capítulos disponibles en línea en inglés, y se pueden utilizar en un segundo 
curso: 


Chapter 9. Optimization 
Chapter 10. Finite-State Markov Chains 


Se requiere un código de acceso y está disponible para todos los profesores que adopten el 
libro. Para más información, visite www.pearsonhighered.com/irc o póngase en contacto 
con su representante de Pearson. 


5. Diapositivas de PowerPoint? están disponibles para las 25 secciones principales del texto; 
también se incluyen más de 75 figuras del texto. 


CARACTERÍSTICAS DISTINTIVAS 


Introducción temprana a los conceptos clave 


Muchas de las ideas fundamentales del álgebra lineal se introducen dentro de las primeras siete 
lecturas en el contexto concreto de R”, y después, gradualmente, se examinan desde diferentes 
puntos de vista. Más adelante, se presentan generalizaciones de estos conceptos como exten- 
siones naturales de ideas familiares, visualizadas a través de la intuición geométrica desarro- 
llada en el capítulo 1. Un logro importante del libro es que el nivel de dificultad es bastante 
uniforme durante todo el curso. 


Una visión moderna de la multiplicación de matrices 


Una buena notación es importante, y el libro refleja la manera en que los científicos e ingenie- 
ros utilizan el álgebra lineal en la práctica. Las definiciones y demostraciones se centran en las 
columnas de una matriz antes que en sus entradas. Un tema central es considerar un producto 
matriz-vector Ax como una combinación lineal de las columnas de A. Este enfoque moderno 
simplifica muchos argumentos, y vincula las ideas de espacio vectorial con el estudio de sis- 
temas lineales. 


Transformaciones lineales 


Las transformaciones lineales forman un “hilo” que se entreteje en la trama del libro. Su uso 
mejora el sentido geométrico del texto. En el capítulo 1, por ejemplo, las transformaciones 
lineales ofrecen una visión dinámica y gráfica de la multiplicación matriz-vector. 


Valores propios y sistemas dinámicos 


Los valores propios se presentan muy pronto en el libro, en los capítulos 5 y 7. Como este 
material se estudia durante varias semanas, los estudiantes tienen más tiempo de lo habitual 
para aprender y revisar tales conceptos fundamentales. Los valores propios se aplican a sis- 
temas dinámicos discretos y continuos, los cuales se presentan en las secciones 1.10, 4.8 
y 4.9, y en las cinco secciones del capítulo 5. Algunos cursos llegan al capítulo 5, después 
de aproximadamente cinco semanas, cubriendo las secciones 2.8 y 2.9 en vez del capítulo 4. 
Estas dos secciones opcionales presentan todos los conceptos de espacio vectorial del capí- 
tulo 4 necesarios para el capítulo 5. 


Ortogonalidad y problemas de mínimos cuadrados 


Estos temas reciben un tratamiento más completo que el que se otorga comúnmente en los 
libros básicos. El Grupo de Estudio del Currículo de Álgebra Lineal ha hecho hincapié en 
la necesidad de contar con una unidad sustancial de ortogonalidad y problemas de mínimos 
cuadrados, ya que la ortogonalidad desempeña un importante papel en los cálculos compu- 
tacionales y en el álgebra lineal numérica, y porque, con frecuencia, en el trabajo práctico 
surgen sistemas lineales inconsistentes. 
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CARACTERÍSTICAS PEDAGÓGICAS 


Aplicaciones 


Una amplia selección de aplicaciones muestra el poder del álgebra lineal para explicar princi- 
pios fundamentales y simplificar los cálculos en ingeniería, ciencias de la computación, mate- 
máticas, física, biología, economía y estadística. Algunas aplicaciones se presentan en secciones 
separadas, mientras que otras se explican con ejemplos y ejercicios. Además, cada capítulo se 
inicia con un ejemplo introductorio que prepara el escenario para algunas aplicaciones del ál- 
gebra lineal y sirve de base para el desarrollo de las matemáticas que siguen. Después, el texto 
considera nuevamente la aplicación en una sección cercana al final del capítulo. 


Un fuerte énfasis geométrico 


Todos los conceptos importantes en el curso cuentan con una interpretación geométrica, ya 
que muchos estudiantes aprenden mejor cuando logran visualizar una idea. Aquí se presentan 
más dibujos de lo habitual, y algunas de las figuras nunca antes se han presentado en un libro 
de álgebra lineal. 


Ejemplos 

Este libro dedica una mayor proporción de su material de exposición a ejemplos, en compa- 
ración con la mayoría de libros de álgebra lineal. Hay más ejemplos de los que un profesor 
presenta normalmente en clase. Puesto que los ejemplos se escribieron con sumo cuidado y 
con detalle, los estudiantes pueden leerlos por su cuenta. 


Teoremas y demostraciones 


Los resultados importantes se establecen como teoremas. Otros datos útiles se presentan en 
recuadros, para una fácil localización. La mayoría de los teoremas incluyen demostraciones 
formales, escritas pensando en el alumno principiante. En algunos casos, los cálculos esencia- 
les de una demostración se muestran en un ejemplo cuidadosamente elegido. Algunas com- 
probaciones de rutina se dejan para los ejercicios, cuando sea benéfico para los estudiantes. 


Problemas de práctica 


Antes de cada conjunto de ejercicios se incluyen problemas de práctica seleccionados con 
gran cuidado. Las soluciones completas se presentan después del conjunto de ejercicios. Es- 
tos problemas se centran en los aspectos problemáticos del conjunto de ejercicios o sirven de 
“calentamiento” para los ejercicios; con frecuencia, las soluciones contienen útiles consejos 
O advertencias acerca del trabajo que hay que realizar. 


Ejercicios 

El gran número de ejercicios incluye desde algunos que tienen que ver con cálculos de rutina 
hasta preguntas conceptuales que requieren de mayor reflexión. Un buen número de preguntas 
innovadoras destacan las dificultades conceptuales que he encontrado en los documentos de 
los estudiantes en los últimos años. Cada conjunto de ejercicios está cuidadosamente organi- 
zado en el mismo orden general que el libro, de manera que las tareas se pueden encontrar 
fácilmente cuando solo se ha estudiado una parte de la sección. Una característica notable de 
los ejercicios es su sencillez numérica. El contenido de los problemas se puede ordenar rápi- 
damente, para que los estudiantes dediquen poco tiempo a los cálculos numéricos. Los ejerci- 
cios se concentran en enseñar a razonar antes que en realizar cálculos mecánicos. Los ejercicios 
de la cuarta edición conservan la integridad de los que se incluyeron en la tercera edición, y 
presentan nuevos problemas para estudiantes y profesores. 

Los ejercicios marcados con el símbolo [M] están diseñados para trabajarse con la ayuda 
de un “programa de Matrices” (por ejemplo, programas computacionales, como MATLAB, 
Maple'M, Mathematica%, MathCad*, o DeriveTM, o calculadoras programables con capacida- 
des matriciales, como las que fabrica Texas Instruments). 
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APOYO EN LÍNEA 


Preguntas verdadero/falso 


Para animar a los estudiantes a leer todo el libro y a pensar críticamente, he desarrollado 
300 preguntas sencillas de falso/verdadero que se presentan en 33 secciones del libro, justo 
después de los problemas computacionales. Estas preguntas se pueden contestar directamente 
del libro, y preparan al estudiante para los problemas conceptuales que siguen. Los estudian- 
tes aprecian estas preguntas una vez que valoran la importancia de leer con cuidado el libro. 
Con base en las pruebas de clase y los análisis con los estudiantes, decidí no incluir las res- 
puestas en el libro. Se cuenta con 150 preguntas adicionales de falso/verdadero (casi siem- 
pre al final de los capítulos) para comprobar la comprensión del material. El libro presenta 
solo respuestas con V o F para la mayoría de estas preguntas, pero omite las justificaciones 
de las respuestas (las cuales, por lo general, requieren de cierto razonamiento). 


Ejercicios de escritura 


La capacidad de escribir enunciados matemáticos coherentes en español es esencial para todos 
los estudiantes de álgebra lineal, y no solo para aquellos que cursan un posgrado en matemáti- 
cas. El libro incluye muchos ejercicios para los que una justificación por escrito es parte de la 
respuesta. Los ejercicios conceptuales que requieren una prueba corta, por lo general, incluyen 
consejos que ayudan a los estudiantes a comenzar. Para todos los ejercicios de escritura de 
numeración impar, en la parte final del libro, se incluye ya sea una solución o una sugerencia. 


Temas computacionales 


El libro hace hincapié en los efectos de la computadora tanto en el desarrollo como en la prác- 
tica del álgebra lineal en las ciencias y la ingeniería. Las frecuentes notas numéricas llaman 
la atención en torno a problemas computacionales; además, distinguen entre los conceptos 
teóricos, como la inversión de matrices, y las implementaciones computacionales, como la 
factorización LU. 


El sitio Web en www.pearsonenespañol.com/lay contiene material de apoyo para el libro de 
texto. Para los estudiantes, incluye hojas de repaso y exámenes de práctica (con soluciones) 
que cubren los temas principales en el libro. Estas secciones provienen directamente de cur- 
sos que he impartido en los últimos años. Cada hoja de repaso identifica definiciones clave, 
así como teoremas y habilidades de una parte específica del libro. 


Aplicaciones de los capítulos 


El sitio Web también contiene siete estudios de caso, los cuales amplían los temas introdu- 
cidos al inicio de cada capítulo, al agregar datos del mundo real y la posibilidad de realizar 
una exploración más profunda. Por otro lado, más de veinte proyectos de aplicación amplían 
los temas del libro e introducen nuevas aplicaciones, como splines cúbicos, rutas de vuelo 
de aerolíneas, matrices de dominio en competencias deportivas y códigos de corrección de 
errores. Algunas aplicaciones matemáticas son técnicas de integración, ubicación de raíces 
polinomiales, secciones cónicas, superficies cuadráticas y extremos de funciones de dos va- 
riables. También se incluyen temas de álgebra lineal numérica, como números de condición, 
factorizaciones de matrices y el método QR para encontrar valores propios. Entretejidos en 
cada análisis, se encuentran ejercicios que pueden implicar grandes conjuntos de datos (por 
lo que requieren de tecnología para su solución). 


Introducción a la tecnología 


Si el curso incluye un trabajo con MATLAB, Maple, Mathematica o calculadoras TL se 
puede leer uno de los proyectos en el sitio Web para tener una introducción a la tecnología. 


COMPLEMENTOS 


AGRADECIMIENTOS 
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Archivos de datos 


Cientos de archivos contienen datos de 900 ejercicios del texto, estudios de caso y proyec- 
tos de aplicación. Los datos están disponibles en www.pearsonenespañol.com/lay en una 
variedad de formatos, para MATLAB, Maple, Mathematica y las calculadoras graficadoras 
TI-83+/86/89. Al permitir a los alumnos acceder a las matrices y los vectores de un problema 
particular con solo pulsar unas cuantas teclas, los archivos de datos eliminan los errores de 
captura de datos y ahorran tiempo en la tarea. 


Proyectos MATLAB 


Estos proyectos de exploración invitan a los estudiantes a descubrir los aspectos matemáti- 
cos y numéricos básicos de álgebra lineal. Escritos por Rick Smith, se han desarrollado para 
acompañar los cursos de álgebra lineal computacional en la Universidad de Florida, que han 
utilizado Álgebra lineal y sus aplicaciones durante muchos años. Se hace referencia a los 
proyectos por medio de un icono [w] en puntos adecuados del libro. Alrededor de la mitad 
de los proyectos exploran conceptos fundamentales, como el espacio columna, la diagonali- 
zación y las proyecciones ortogonales; varios proyectos tratan temas numéricos, tales como 
flops, métodos iterativos y DVS, y algunos más exploran aplicaciones como la interpolación 
de Lagrange y las cadenas de Markov. 
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Nota para los estudiantes 


Este curso es potencialmente el más interesante y valioso de los cursos de matemáticas de 
licenciatura. De hecho, algunos estudiantes me han escrito o han hablado conmigo después 
de la graduación para decirme que aún utilizan este libro de cuando en cuando como una refe- 
rencia en su carrera en las grandes corporaciones y en las escuelas de posgrado de ingeniería. 
Los siguientes comentarios ofrecen algunos consejos prácticos e información para ayudarle 
a dominar el material y disfrutar del curso. 

En álgebra lineal, los conceptos son tan importantes como los cálculos. Los sencillos 
ejercicios numéricos que se incluyen al principio de cada conjunto de ejercicios solo le 
ayudarán a comprobar su comprensión de los procedimientos básicos. Más adelante en su 
carrera, las computadoras harán los cálculos, pero usted tendrá que elegir cuáles son perti- 
nentes, saber interpretar los resultados, y después explicar los resultados a otras personas. 
Por esta razón, muchos ejercicios en el libro le piden que explique o justifique sus cálculos. 
Con frecuencia se solicita una explicación por escrito como parte de la respuesta. Para los 
ejercicios con numeración impar, se incluye ya sea la explicación deseada o, al menos, una 
buena sugerencia. Debe evitar la tentación de consultar esas respuestas antes de haber tra- 
tado de escribir la solución. De lo contrario, es probable que crea que entiende algo cuando 
en realidad no es así. 

Para dominar los conceptos de álgebra lineal, tendrá que leer y releer el texto con cuida- 
do. Los nuevos términos aparecen en negritas, a veces dentro de un recuadro de definición. 
Al final del libro se incluye un glosario. Algunos hechos importantes se establecen como 
teoremas o se destacan en recuadros sombreados, para una fácil localización. Le animo a que 
lea las primeras cinco páginas del prefacio para aprender más acerca de la estructura de este 
libro. Esto le dará una idea para comprender cómo puede continuar el curso. 

En un sentido práctico, el álgebra lineal es un lenguaje. Usted tiene que aprender este 
lenguaje de la misma manera que un idioma extranjero, esto es, con el trabajo diario. El ma- 
terial que se presenta en una sección no es fácil de entender a menos que haya estudiado a 
fondo el libro y que haya trabajado los ejercicios de las secciones anteriores. ¡Mantenerse al 
día con el curso le ahorrará mucho tiempo y angustia! 


Notas numéricas 


Espero que lea las notas numéricas en el texto, incluso si no está utilizando una computadora 
o una calculadora gráfica con el libro. En la vida real, la mayoría de las aplicaciones del ál- 
gebra lineal implican cálculos numéricos que están sujetos a algún error numérico, aunque 
quizás este sea muy pequeño. Las notas numéricas le advertirán las posibles dificultades en 
el uso del álgebra lineal más adelante en su carrera, y si usted estudia las notas ahora, es más 
probable que las recuerde después. 

Si le gusta leer las notas numéricas, es posible que desee tomar un curso más tarde en 
álgebra lineal numérica. Debido a la gran demanda de mayor capacidad para realizar cálcu- 
los, científicos de la computación y matemáticos trabajan en álgebra lineal numérica para 
desarrollar algoritmos de cálculos más rápidos y más confiables, mientras que los ingenie- 
ros eléctricos diseñan computadoras pequeñas y rápidas para ejecutar algoritmos. Este es un 
campo emocionante, y su primer curso de álgebra lineal le ayudará a prepararse para ello. 
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Ecuaciones lineales 


en álgebra lineal 


EJEMPLO INTRODUCTORIO 


Modelos lineales en economía 

e ingeniería 

Al final del verano de 1949, Wassily Leontief, profesor de 
Harvard, introducía con cuidado la última de sus tarjetas 
perforadas en la computadora Mark II de la universidad. 
Las tarjetas contenían información acerca de la economía 
de Estados Unidos; se trataba de un resumen de más de 
250,000 datos generados por la Oficina de Estadística 
Laboral (U.S. Bureau of Labor) durante dos años de intenso 
trabajo. Leontief dividió la economía estadounidense en 
500 “sectores”, que incluían las industrias carbonífera, 
automotriz, de comunicaciones, etcétera. Para cada sector, 
escribió una ecuación lineal que describía cómo la industria 
en cuestión distribuía su producto hacia los otros sectores de 
la economía. Como la computadora Mark II, una de las más 
grandes de su época, no podía manejar el sistema resultante 
de 500 ecuaciones y 500 incógnitas, Leontief redujo el 
problema a un sistema de 42 ecuaciones y 42 incógnitas. 


Programar la Mark II para manejar las 42 ecuaciones 
de Leontief requirió varios meses de trabajo, y él estaba 
ansioso por ver cuánto tardaría la computadora en resolver 
el problema. La máquina emitió zumbidos y sus luces 
parpadearon durante 56 horas antes de que finalmente 
arrojara un resultado. En las secciones 1.6 y 2.6 se analizará 
la naturaleza de esa solución. 


Leontief, galardonado en 1973 con el Premio Nobel de 
Economía, abrió la puerta a una nueva era en la elaboración 
de modelos matemáticos en economía. Sus esfuerzos en 
Harvard, en 1949, representaron uno de los primeros usos 
significativos de las computadoras para analizar lo que, 





en esa época, era un modelo matemático de gran escala. 
Desde entonces, investigadores en muchos otros campos han 
empleado computadoras para analizar modelos matemáticos. 
Debido a las enormes cantidades de datos implicados, 

los modelos, por lo regular, son lineales; es decir, se 


describen mediante sistemas de ecuaciones lineales. 


La importancia del álgebra lineal para diversas 
aplicaciones ha crecido en proporción directa al incremento 
de la capacidad de las computadoras, y cada nueva 
generación de hardware y software dispara la demanda 
de capacidades aun mayores. Por ello, la ciencia de la 
computación está fuertemente vinculada con el álgebra 
lineal a través del explosivo crecimiento de los 
procesamientos en paralelo y el cálculo a gran escala. 


Ahora los científicos e ingenieros trabajan en problemas 
cada vez más complejos, lo que era impensable hace algunas 
décadas. Actualmente, ¡el álgebra lineal tiene mayor valor 
potencial para estudiantes de muchos campos científicos 
y de negocios que cualquier otra materia de matemáticas! 

El material que se presenta en este libro ofrece el 
fundamento para un trabajo posterior en muchas áreas 
interesantes. A continuación se mencionan unas cuantas 
posibilidades; otras se describirán más adelante. 


e Exploración petrolera. Cuando un barco busca 
depósitos submarinos de petróleo, sus computadoras 
resuelven todos los días miles de sistemas de 
ecuaciones lineales. Los datos sísmicos de las 


2 CAPÍTULO 1 Ecuaciones lineales en álgebra lineal 


ecuaciones se obtienen a partir de las ondas de cho- 
que submarinas generadas por explosiones de pistolas 
de aire. Las ondas rebotan en las rocas bajo el agua, y 
los geófonos conectados a la popa del barco mediante 
cables de varios kilómetros se encargan de medirlas. 


e Programación lineal. Actualmente, muchas 
decisiones empresariales importantes se toman con 
base en modelos de programación lineal que utilizan 
cientos de variables. La industria de las aerolíneas, 
por ejemplo, utiliza la programación lineal para 


organizar los itinerarios de las tripulaciones de vuelo, 
monitorizar la ubicación de los aviones o planear la 
variada agenda de los servicios de apoyo, como las 
actividades operativas y de mantenimiento en 

las terminales aéreas. 


Redes eléctricas. Los ingenieros utilizan software 
de simulación para diseñar circuitos eléctricos y 
microchips, lo que implica millones de transistores. 
Dicho software se basa en técnicas de álgebra lineal 
y en sistemas de ecuaciones lineales. 





Los sistemas de ecuaciones lineales constituyen el corazón del álgebra lineal, y este capítulo los 
utiliza para introducir, de manera sencilla y concreta, algunos de los conceptos centrales del 
álgebra lineal. Las secciones 1.1 y 1.2 presentan un método sistemático para resolver sistemas 
de ecuaciones lineales. En este libro se empleará dicho algoritmo para realizar diversos cálcu- 
los. Las secciones 1.3 y 1.4 muestran cómo un sistema de ecuaciones lineales es equivalente a 
una ecuación vectorial y a una ecuación matricial. Esta equivalencia reducirá problemas que 
implican combinaciones lineales de vectores a preguntas acerca de sistemas de ecuaciones 
lineales. Los conceptos fundamentales de generación, independencia lineal y transformacio- 
nes lineales, que se estudiarán en la segunda mitad de este capítulo, desempeñarán un papel 
esencial a lo largo del libro conforme se explore la belleza y el poder del álgebra lineal. 


1.1 | SISTEMAS DE ECUACIONES LINEALES 


Una ecuación lineal en las variables x;,..., x, es una ecuación que puede escribirse en la forma 
41X1 + d2X2 +-** + anXn =b (1) 


donde b y los coeficientes a4,..., an son números reales o complejos, que generalmente se co- 
nocen de antemano. El subíndice n puede ser cualquier entero positivo. En los ejemplos y 
ejercicios del libro, n normalmente está entre 2 y 5. En problemas de la vida real, n podría 
ser 50 o 5000, o incluso mayor. 

Las ecuaciones 


4x —5x2+2=x] y x= 2(W6— x1) + x3 
son lineales porque se pueden reordenar algebraicamente en la forma de la ecuación (1): 
3x1—5x2=-2 y 2x1 +x2— x3 = 2V6 
Las ecuaciones 
4x — 5x2 = xX1X2 y x=2yx¡-6 


no son lineales debido a la presencia de xıx2 en la primera ecuación y de ,/x1 en la segunda. 
Un sistema de ecuaciones lineales (o sistema lineal) es una colección de una o más 
ecuaciones lineales que implican las mismas variables, por ejemplo, x;,..., xy. Un ejemplo es 


2x1 — x2 + 1.5x3 = 8 
X1 = 4x3 = 7 


2) 
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Una solución del sistema es una lista de números (s;, 52,..., sn) que da validez a cada ecuación 
cuando se utilizan los valores sj,..., s, en lugar de x1,..., Xn, respectivamente. Por ejemplo, 
(5, 6.5, 3) es una solución del sistema (2) porque al sustituir estos valores en (2) para x1, x2, 
Xx3, respectivamente, las ecuaciones se simplifican a8 = 8 y -7 = —7. 

El conjunto de todas las posibles soluciones se llama conjunto solución del sistema 
lineal. Se dice que dos sistemas lineales son equivalentes si tienen el mismo conjunto solu- 
ción. Es decir, cada solución del primer sistema es una solución del segundo sistema, y cada 
solución del segundo sistema también es una solución del primero. 

Es fácil encontrar el conjunto solución de un sistema de dos ecuaciones lineales con dos 
variables porque equivale a obtener la intersección de dos rectas. Un problema común es 


X1 — 2x, = —1 
=x +3% = 3 


Las gráficas de esas ecuaciones son líneas rectas, las cuales se denotan como € y £2. Un par 
de números (x1, x2) satisface ambas ecuaciones del sistema si y solo si el punto (x1, x2) está 
sobre £1 y £2. En el sistema anterior, la solución es el único punto (3, 2), lo que puede com- 
probarse fácilmente. Véase la figura 1. 








FIGURA 1 Exactamente una solución. 


Desde luego, dos rectas no necesitan intersecarse en un solo punto; podrían ser parale- 
las, o coincidir y, así, “intersecarse” en todos los puntos de la recta. La figura 2 muestra las 
gráficas que corresponden a los siguientes sistemas: 














a) X1 — 2x2 = —1 b) X1 —=2x» =-—1 
=x1+2x= 3 =x1i+2x= 1 
22 * 
27 24 
HA A HA t H xX etA HA 1 t xX 
l 4 L 
z L L 
a) b) 


FIGURA 2 a) No hay solución. b) Número infinito de soluciones. 


Las figuras 1 y 2 ilustran el siguiente hecho general acerca de los sistemas lineales, el 
cual se comprobará en la sección 1.2. 
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Un sistema de ecuaciones lineales tiene 


1. ninguna solución, o 
2. exactamente una solución, o 


3. un número infinito de soluciones. 


Se dice que un sistema de ecuaciones lineales es consistente si tiene una solución o un nú- 
mero infinito de soluciones; un sistema es inconsistente cuando no tiene ninguna solución. 


Notación matricial 


La información esencial de un sistema lineal puede registrarse de forma compacta en un arre- 
glo rectangular llamado matriz. Dado el sistema 


xı — 2x: + x= 0 
2x2 — 8x3 = 8 G) 
—4x1 + 5x2 + 9x3 = —9 


con los coeficientes de cada variable alineados en columnas, la matriz 


f =2:. 1 
0 2 -8 
=4. 3. 9 


12 1 0 
0. 2-8 8 (4) 
24 5 9-9 


se llama matriz aumentada del sistema. (Aquí la segunda fila contiene un cero porque 
la segunda ecuación podría escribirse como O - x¡ + 2x7 — 8x3 = 8). La matriz aumentada 
de un sistema consiste en la matriz de coeficientes con una columna adicional que contiene 
las constantes de los miembros derechos de las ecuaciones. 

El tamaño de una matriz indica su número de filas y columnas. La matriz aumentada (4) 
tiene 3 filas y 4 columnas, por lo que es una matriz de 3 x 4 (que se lee “3 por 4”). Sim y n 
son enteros positivos, entonces una matriz de m x n es un arreglo rectangular de números 
con m filas y n columnas. (Siempre va primero el número de filas). La notación matricial 
simplificará los cálculos en los ejemplos que siguen. 


Solución de un sistema lineal 


Esta sección y la siguiente describen un algoritmo, o un procedimiento sistemático, para re- 
solver sistemas lineales. La estrategia básica es remplazar un sistema por otro equivalente (es 
decir, uno con el mismo conjunto solución) y que sea más fácil resolver. 

En general, use el término xı de la primera ecuación de un sistema para eliminar los 
términos x, en las ecuaciones restantes. Después, utilice el término x, en la segunda ecuación 
para eliminar los términos x, en las demás ecuaciones, y así sucesivamente, hasta que final- 
mente obtenga un sistema equivalente de ecuaciones muy sencillo. 

Se utilizan tres operaciones básicas para simplificar un sistema lineal: remplazar una 
ecuación por la suma de esta y un múltiplo de otra ecuación, intercambiar dos ecuaciones, y 
multiplicar todos los términos de una ecuación por una constante distinta de cero. Después del 
primer ejemplo, resultará claro por qué esas tres operaciones no alteran el conjunto solución 
del sistema. 
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EJEMPLO 1  Resuelva el sistema (3). 


SOLUCIÓN Aquí se muestra el procedimiento de eliminación, con y sin notación matricial, 
y los resultados se colocan uno al lado del otro para facilitar la comparación: 


xı — 2x + x= 0 1-2 1.0 
2x2 — 8x3 = 8 0 2-8 8 
4x1 + 5x2 + 9x3 = —9 =E I TIA 


Mantenga xı en la primera ecuación y elimínela en las otras ecuaciones. Para hacerlo, sume 
la ecuación 1 multiplicada por 4 a la ecuación 3. Después de cierta práctica, estos cálculos 
se podrán efectuar mentalmente: 





4- [ecuación 1]: 4x1 — 8x2 + 4x3 = 0 
+ [ecuación 3]: —4x1 + 5x2 + 9x3 = —9 
[nueva ecuación 3]: — 3x2 + 13x3 = —9 


El resultado de este cálculo se escribe en lugar de la tercera ecuación original: 


x1=2x+ x= 0 1-2 1.0 
2x2 — 8x3= 8 0 2-8 8 
— 3x2 + 13x3 = —9 0-3 13 -9 


Ahora, multiplicamos la ecuación 2 por 1/2 para así obtener 1 como coeficiente de x». (Este 
cálculo simplificará la aritmética en el siguiente paso). 


x1—2x+ x3= 0 1-2 1 0 
Ay 4x3 = 4 0 1 —4 4 
— 3x2 + 13x3 = —9 0-3 13 -9 


Utilice x de la ecuación 2 para eliminar —3x2 en la ecuación 3. El cálculo “mental” es 





3-[ecuación 2]: 3x2 — 12x3 = 12 
+ [ecuación 3]: —3x2 + 13x3 = —9 
[nueva ecuación 3]: x= 3 
El nuevo sistema tiene forma triangular:! 
x1—2x+ x3 = 0 1 -2 1 0 
X2 — 4x3 =4 0 1 —4 4 
x3 =3 0. 0 1 3 


Finalmente, se desea eliminar el término —2x de la ecuación 1, pero es más eficiente usar 
primero x3 de la ecuación 3 para eliminar los términos —4x3 y +x3 en las ecuaciones 2 y 1. 
Los dos cálculos “mentales” son 








4-[ec. 3]: 4x3 = 12 —1-[ec. 3]: — x3 = —3 
+ [ec. 2]: x2 — 4x3; = 4 + [ec. 1]: xı — 2x2 + x3 = 0 
[nueva ec. 2]: xz = 16 [nueva ec. 1]: xı — 2x2 =-3 


1 En la siguiente sección se remplazará el término intuitivo triangular por uno más preciso. 
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P 
Y (29, 16, 3) 


Cada una de las ecuaciones 
originales determina un plano 
en el espacio tridimensional. 
El punto (29, 16, 3) pertenece 
a los tres planos. 


Es conveniente combinar los resultados de esas dos operaciones: 


xı — 2x2 = -3 1-2 0 33 
X2 = 16 0 1 0 16 
de da 28 0 0 1 3 


Ahora, una vez que se ha eliminado la columna que está sobre x3 en la ecuación 3, regrese 
a x2 en la ecuación 2 y utilícela para eliminar —2x2 sobre ella. Gracias al trabajo previo con 
x3, ahora no hay operaciones que impliquen términos con x3. Sume dos veces la ecuación 2 
a la ecuación 1 para obtener el sistema: 


X1 = 29 1 0 0 29 
x2 =16 0 1 0 16 
sra 0 0 1 3 


En esencia, el proceso está terminado. Se observa que la única solución del sistema original 
es (29, 16, 3). Sin embargo, puesto que son muchos los cálculos realizados, es recomendable 
comprobar los resultados. Para comprobar que (29, 16, 3) es una solución, sustituya esos 
valores en el lado izquierdo del sistema original, y calcule: 


(29) - 2(16) + (B)=29-32+3=0 
2(16) — 8(3) = 32- 24 = 8 
—4(29) + 5(16) + 9(3) = —116 + 80 + 27 = —9 


Los resultados concuerdan con el lado derecho del sistema original, de manera que (29, 16, 3) 
es una solución del sistema. E 


El ejemplo 1 muestra cómo las operaciones con las ecuaciones de un sistema lineal 
corresponden a las operaciones en las filas adecuadas de la matriz aumentada. Las tres ope- 
raciones básicas mencionadas con anterioridad corresponden a las siguientes operaciones 
en la matriz aumentada. 


OPERACIONES ELEMENTALES DE FILA 


1. (Remplazo) Sustituir una fila por la suma de sí misma y un múltiplo de otra fila.? 
2. (Intercambio) Intercambiar dos filas. 


3. (Escalamiento) Multiplicar todos los elementos de una fila por una constante dife- 
rente de cero. 


Las operaciones de fila pueden aplicarse a cualquier matriz, no solo a las matrices au- 
mentadas de un sistema lineal. Dos matrices son equivalentes por filas si existe una secuen- 
cia de operaciones elementales de fila que transforme una matriz en otra. 

Es importante observar que las operaciones de fila son reversibles. Si dos filas se inter- 
cambian, es posible hacerlas retornar a sus posiciones originales mediante otro intercambio. 
Si una fila se multiplica por una constante c distinta de cero, entonces al multiplicar la nueva 
fila por 1/c se obtiene la fila original. Por último, considere una operación de remplazo que 
implica a dos filas —por ejemplo, las filas 1 y 2— y suponga que a la fila 2 se le suma la 
fila 1 multiplicada por c para producir una nueva fila 2. Para “revertir” esta operación, sume 
la fila 1 multiplicada por —c a la nueva fila 2 para así obtener la fila 2 original. Véase los 
ejercicios 29 al 32 al final de esta sección. 


2 Una forma alternativa de expresar la operación de remplazo de filas es: “Sume a una fila un múltiplo de otra fila”. 
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Por el momento, estamos interesados en las operaciones de fila sobre la matriz aumen- 
tada de un sistema de ecuaciones lineales. Suponga que un sistema se transforma en otro 
mediante operaciones de fila. Considerando cada tipo de operación de fila, puede verse que 
cualquier solución del sistema original continúa siendo una solución del nuevo sistema. A la 
inversa, puesto que el sistema original se puede obtener mediante operaciones de fila sobre 
el nuevo sistema, cada solución del nuevo sistema también es solución del sistema original. 
Este análisis justifica el siguiente enunciado. 


Si las matrices aumentadas de dos sistemas lineales son equivalentes por filas, entonces 
los dos sistemas tienen el mismo conjunto solución. 


A pesar de que el ejemplo 1 es largo, después de cierta práctica se desarrollará habilidad 
para realizar los cálculos con rapidez. En el texto y en los ejercicios de este libro, las opera- 
ciones de fila por lo general serán muy fáciles de efectuar, lo que permitirá al lector enfocarse 
en los conceptos subyacentes. Pero debe aprender a realizar con exactitud las operaciones de 
fila porque se utilizarán a lo largo del libro. 

El resto de esta sección muestra cómo emplear operaciones de fila para determinar el 
tamaño de un conjunto solución, sin resolver completamente el sistema lineal. 


Preguntas de existencia y unicidad 


La sección 1.2 mostrará por qué un conjunto solución de un sistema lineal puede no contener 
ninguna solución, o bien, tener una solución o un número infinito de soluciones. Las res- 
puestas a las siguientes dos preguntas determinarán la naturaleza del conjunto solución de 
un sistema lineal. 

Para determinar qué posibilidad es verdadera para un sistema particular, nos planteamos 
dos preguntas. 


DOS PREGUNTAS FUNDAMENTALES ACERCA DE UN SISTEMA LINEAL 


1. ¿El sistema es consistente, es decir, al menos existe una solución? 


2. Si existe una solución, ¿solo hay una, es decir, la solución es única? 


Estas dos preguntas se presentarán a lo largo del libro, en diversas circunstancias. Esta sec- 
ción y la siguiente le mostrarán cómo responder a esas preguntas usando operaciones de fila 
sobre la matriz aumentada. 


EJEMPLO 2 Determine si el siguiente sistema es consistente 


x—2x+ x3= 0 
8 
—4Ax1 + 5x2 + 9x3 = —9 


2x2 = 8x3 


SOLUCIÓN Este es el sistema del ejemplo 1. Suponga que se han efectuado las operaciones 
de fila necesarias para obtener la forma triangular 


xı — 2x2 + x3=0 1-2 1.0 
xX — 4x3 = 4 0 g 4 
0 0 1 3 


x3 =3 


En este punto, conocemos x3. Si se sustituyera el valor de x3 en la ecuación 2, entonces se 
podría calcular x, y, por lo tanto, se podría obtener xı de la ecuación 1. Así que existe una 
solución; el sistema es consistente. (En efecto, xz está determinada de manera unívoca por la 
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Este sistema es inconsistente 
porque no existe un punto que 
pertenezca a los tres planos de 
manera simultánea. 





ecuación 2 ya que x3 sólo tiene un valor posible, y en consecuencia xı está determinada de 
forma unívoca por la ecuación 1. Por lo tanto, la solución es única). E 
EJEMPLO 3 Determine si el siguiente sistema es consistente 


X2 — 4x3 =8 
2x1 — 3x2 + 2x3 = 1 (5) 
5x1 — 8x2 + 7x3 = 1 


SOLUCIÓN La matriz aumentada es 


0 1-4 8 
2 2 
5—8 7 


23 2. T 
0 1-4 8 
5-8 7 1 


Para eliminar el término 5x; en la tercera ecuación, a la fila 3 se suma la fila 1 multiplicada 
por —5/2: 


o O A 
0 1 -4 8 (6) 
0 —1/2 2 -3/2 


Ahora, use el término x2 en la segunda ecuación para eliminar el término —(1/2)x2 en la 
tercera ecuación. A la fila 3, sume la fila 2 multiplicada por 1/2: 


Res? DY d 
0 1—4 8 (7) 
0. 0 0 5/2 


Ahora la matriz aumentada está en forma triangular. Para interpretarla correctamente, con- 
viene regresar a la notación con ecuaciones: 


2x1 —3x2+2x3= 1 
X= 4x3 = 8 (8) 
0 =5/2 


La ecuación 0 = 5/2 es una forma abreviada de Ox, + Ox, + 0x3 = 5/2. Este sistema en 
forma triangular, evidentemente, tiene una contradicción inherente. No existen valores de x;, 
x2, x3 que satisfagan la ecuación (8) porque la ecuación O = 5/2 nunca es válida. Como (5) y 
(8) tienen el mismo conjunto solución, entonces el sistema original es inconsistente (es decir, 
no tiene solución). E 


Preste atención a la matriz aumentada en (7). Su última fila es característica de un sis- 
tema inconsistente en forma triangular. 
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NOTA NUMÉRICA 





En problemas del mundo real, los sistemas de ecuaciones lineales se resuelven en compu- 
tadora. Para una matriz de coeficientes cuadrada, los programas computacionales casi 
siempre utilizan el algoritmo de eliminación presentado aquí y en la sección 1.2, aun- 
que ligeramente modificado para obtener mayor exactitud. 

La gran mayoría de los problemas de álgebra lineal en los negocios y en la indus- 
tria se resuelven con programas que emplean aritmética de punto flotante. Los núme- 
ros se representan como decimales +.d¡***d, X 10", donde r es un entero, y el número p 
de dígitos a la derecha del punto decimal, por lo general, está entre 8 y 16. La aritmética 


con dichos números normalmente es inexacta, porque el resultado debe redondearse 
(o truncarse) al número de dígitos almacenados. Se introduce el “error de redondeo” 
cuando un número como 1/3 ingresa a la computadora, ya que su representación deci- 
mal debe ser aproximada por una cantidad finita de dígitos. Por fortuna, las inexactitu- 
des en la aritmética de punto flotante rara vez causan problemas. Las notas numéricas 
en este libro ocasionalmente le advertirán sobre asuntos que deberá considerar más 
adelante en su carrera profesional. 


PROBLEMAS DE PRÁCTICA 


A lo largo del libro, es conveniente resolver los problemas de práctica antes de trabajar los 
ejercicios. Las soluciones se presentan después de cada conjunto de ejercicios. 


1. Exprese con palabras la siguiente operación elemental de fila que debe efectuarse en el 
sistema para resolverlo. [En a) es posible más de una respuesta]. 


a) xı + 4x2 — 2x3 + 8x4 = 12 b) xi — 3x2 + 5x3 — 2x4 = 0 
x2 — 1x3 + 2x4 = —4 X2 + 8x3 =-4 

5x3 = x= 7 2x3 =- 3 

x3 + 3x4 = —5 as i 


2. La matriz aumentada de un sistema lineal se transformó, mediante operaciones de fila, 
en la forma que se indica a continuación. Determine si el sistema es consistente. 


1 5 2 —6 
0 4-7 2 
0 0 5 0 


3. ¿(, 4, —2) es una solución para el siguiente sistema? 


5x1 — Xx +2x3= 7 
—2x1 + 6x2 + 9x3 = 
—7xX1 + 5x2 = 3x3 = 


Pl 
| 
XA O 


4. ¿Para qué valores de h y k es consistente el siguiente sistema? 


2x1 — Q= h 
—6X1 + 3x2 = k 
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1.1 EJERCICIOS 


En los ejercicios 1 a 4 resuelva cada sistema utilizando operaciones 
elementales de fila sobre las ecuaciones o sobre la matriz aumentada. 
Siga el procedimiento de eliminación sistemático explicado en esta 
sección. 


1. xı + 5x2 = 7 
—2x1 ex 1x2 =-=5 


2; 3x1 + 6x2 =-3 
5X1 + 1x2 = 10 


3. Encuentre el punto (x1, x2) que pertenece tanto a la recta xı + 
2x2 = 4 como a la recta xı — x2 = 1. Observe la figura. 


X2 


x-x=1 





Xi 
x1+2x,=4 


4. Obtenga el punto de intersección de las rectas xı + 2x2 = —13 
y 3x1 — 2x7 = l. 


En los ejercicios 5 y 6 considere que cada matriz es la matriz aumen- 
tada de un sistema lineal. Exprese con palabras las siguientes dos 
operaciones elementales de fila que deben realizarse para resolver 
el sistema. 


1-4-3 0 7 

5 0 1 4 0 6 
“10 0 1 0 2 
0.0 0 1-3 

1 —6 4 0 -li 

6 0 2 -7 0 4 
“10 0 1 2-3 
0 0 1.2 


En los ejercicios 7 a 10, la matriz aumentada de un sistema lineal 
se redujo mediante operaciones de fila a la forma indicada. En cada 
caso, continúe con las operaciones adecuadas de fila y describa el 
conjunto solución del sistema original. 


1 7 —4 

0 1 -—1 3 

i o 0 0 1 

0o 0 1 -2 
1 -5 4 0 0 
8 0 1 0 1-0 
"0 0 3 0 0 
0o 0 0 2 0 
1-1. 0. 0-5 
9 0. 1-2 0 -7 
“0 0 1-3 2 
0.0 1 4 


1 3 0 -2 -7 
0 1 0 3 6 
0 0 1 0 2 
0 0 0 1 -—2 


En los ejercicios 11 a 14 resuelva los sistemas. 
11. X2 + 5x3 = —4 


X1 + 4x2 + 3x3 = 
2x1 +7x, + X3 = —2 


| 
| 
N 


12. X1— 5x2 + 4x3 = -3 
2x1 = 1x2 + 3x3 = —2 
—2x1 + xXx + 1x3 = -l1 
13. X1 = 3x3 = 
2x1 + 2x2 + 9x3 == 
X2 + 5x3 = 2 
14. 2x1 = 6x3 = -8 
Xx + 2x3 =5003 


3x1 + 6x2 =, 2x3 = —4 


En los ejercicios 15 y 16 determine si los sistemas son consistentes. 
No resuelva por completo dichos sistemas. 
15. xı — 6x2 =5 
x2 — 4x3 + xa=0 
=x + 6x2 + x3 + 5x4 =3 
—X2 + 5x3 + 4x4=0 


16. 2x — 4x4 =-—10 
3x2 + 3x3 = 0 

x3 + 4x4, = —l1 

—3x1 +2x2+3x3+ x= 5 





17. ¿Las tres rectas 2x¡ + 3x2 = —1, 6x1 + 5x2 =0, y 2x1 — 5x2 =7 
tienen un punto común de intersección? Explique su respuesta. 


18. Diga si los tres planos 2x¡ + 4x7 + 4x3 = 4, x2 — 2x3 = —2, y 
2x1 + 3x2 = 0 tienen al menos un punto común de intersección. 
Explique su respuesta. 


En los ejercicios 19 a 22, determine el valor o los valores de h 
tales que la matriz sea la matriz aumentada de un sistema lineal 


consistente. 

1 h 4 1 h —5 
19. | i d 2. E a J 

1 4 2 —4 12 h 
2. ls ; z] 22. | FE z 


En los ejercicios 23 y 24, se citan enunciados clave de esta sección, 
con ligeras modificaciones (pero manteniendo su validez), o se al- 
teraron de manera que, en algunos casos, son falsos. Marque cada 
enunciado como verdadero o falso, y justifique su respuesta. (Si el 


enunciado es verdadero, entonces indique la ubicación aproximada 
donde se presenta un enunciado similar, o haga referencia a una defi- 
nición o un teorema. Si la afirmación es falsa, indique la ubicación 
de un enunciado que se haya citado o empleado incorrectamente, 
o cite un ejemplo que muestre la falsedad del enunciado en todos 
los casos). Preguntas similares de falso/verdadero se presentarán en 
muchas secciones del libro. 


23. a) Todas las operaciones elementales de fila son reversibles. 
b) Una matriz de 5 x 6 tiene seis filas. 


c) El conjunto solución de un sistema lineal que incluye a las 
variables xj,..., x, es una lista de números (s1,..., $n) que 
da validez a cada ecuación del sistema cuando se sustitu- 
yen los valores s;,..., Sn POr XJ,..., Xy, respectivamente. 


d) Las dos preguntas fundamentales acerca de un sistema lineal 
incluyen existencia y unicidad. 


24. a) Dos matrices son equivalentes por filas si tienen el mismo 
número de filas. 


b) En una matriz aumentada, las operaciones elementales de 
fila no modifican nunca el conjunto solución del sistema li- 
neal asociado. 


c) Dos sistemas lineales equivalentes pueden tener diferentes 
conjuntos solución. 


d) Un sistema consistente de ecuaciones lineales tiene una o 
más soluciones. 


25. Encuentre una ecuación que incluya a g, h y k, y que permita 
que esta matriz aumentada corresponda a un sistema consis- 
tente: 

1-4 7 g 
0. 3-5 h 
2. 5-9 k 


26. Suponga que el sistema que aparece a continuación es consis- 
tente para todos los posibles valores de f y g. ¿Qué puede decir- 
se acerca de los coeficientes c y d? Justifique su respuesta. 


2x1 A 4x =f 


cxi + dx2 = g 





27. Suponga que a, b, c y d son constantes tales que a es diferente 
de cero y el sistema que aparece a continuación es consisten- 
te para todos los posibles valores de f y g. ¿Qué podría decir 
acerca de los números a, b, c y d? Justifique su respuesta. 


axı + bu = f 





cxi + dx2 = g 


28. Construya tres diferentes matrices aumentadas para los sistemas 
lineales cuyo conjunto solución es xı = 3, x2 = —2, x3 = —1. 
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En los ejercicios 29 a 32, encuentre la operación elemental de fila 
que transforme a la primera matriz en la segunda, y luego encuentre 
la operación de fila inversa que transforme a la segunda matriz en la 
primera. 


0-2 5 3 -=L 06 


29. |1 3 A A O E 
Sl casa 5 
Y BN SA 


30. 


oo 
I | 
uN 
_ 
om 


3.0 5-2 8 


1 2 -5 
Ee 
4 -12 


32. 


oo 
a 


Un importante asunto en el estudio de transferencia de calor es deter- 
minar la distribución de temperatura de estado estable de una placa 
delgada cuando se conoce la temperatura en los bordes. Suponga que 
la placa que se ilustra en la figura representa una sección transversal 
de una viga de metal, con flujo de calor despreciable en la dirección 
perpendicular a la placa. Sean T;,..., Ta las temperaturas en los cua- 
tro nodos interiores de la malla en la figura. La temperatura en un 
nodo es aproximadamente igual al promedio de las temperaturas de 
los cuatro nodos más cercanos, esto es, a la izquierda, arriba, a la 
derecha y abajo.’ Por ejemplo, 


Tı = (10 + 20 + Tz + T4)/4, o 4i- T — T,= 30 














20° 20° 
10° -| 2 40° 
10° AN 40° 
30° 30° 


33. Escriba un sistema de cuatro ecuaciones cuya solución dé esti- 
maciones de las temperaturas T1,..., T4. 


34. Resuelva el sistema de ecuaciones del ejercicio 33. [Sugerencia: 
Para conseguir rapidez en el cálculo, intercambie las filas 1 y 4 
antes de iniciar las operaciones de “remplazo”]. 


3 Véase Frank M. White, Heat and Mass Transfer (Reading, MA: Addison- 
Wesley Publishing, 1991), pp. 145-149. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. a) Para efectuar “cálculos a mano”, la mejor elección es intercambiar las ecuaciones 3 
y 4. Otra posibilidad es multiplicar la ecuación 3 por 1/5. O bien, remplazar la ecua- 
ción 4 por su suma con la fila 3 multiplicada por — 1/5. (En cualquier caso, no utilice 
x en la ecuación 2 para eliminar 4x, en la ecuación 1. Espere hasta que se haya lo- 
grado una forma triangular y los términos x3 y x4 se hayan eliminado de las primeras 


dos ecuaciones). 
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b) El sistema tiene forma triangular. La simplificación ulterior inicia con x4 en la cuarta 
ecuación. Utilice x4 para eliminar todos los términos x4 sobre ella. Ahora el paso 
adecuado es sumar la ecuación 4, multiplicada por 2, a la ecuación 1. (Luego, vaya 
a la ecuación 3 y multiplíquela por 1/2, y después utilice la ecuación para eliminar 
los términos x3 sobre ella). 


2. El sistema correspondiente a la matriz aumentada es 
xı + 5x2 + 2x3 = —6 
4x2 = 1x3 2 
5x3 = 0 


La tercera ecuación hace x3 = 0, el cual, desde luego, es un valor permitido para x3. Des- 
pués de eliminar los términos x3 en las ecuaciones 1 y 2, se podría continuar para obtener 
valores únicos de xı y x2. Así que existe una solución, y es única. Esta situación contrasta 
con la del ejemplo 3. 


3. Es fácil comprobar si una lista específica de números es una solución. Sean xı = 3, 
x2 = 4, y x3 = —2, y encuentre que 
53) — (4+2(-2= 15- 4- 4=7 
—2(3) + 6(4) + 9—2) = -6+24 -—18=0 


Como (3, 4, —2) satisface las dos 
primeras ecuaciones, está sobre 
la recta de intersección de los 
primeros dos planos. Puesto que 
(3, 4, —2) no satisface las tres 
ecuaciones, se concluye que no 
pertenece a los tres planos. 


13) + 5(4) - 3(22) =-21+20+ 6=5 


Aunque las primeras dos ecuaciones se satisfacen, no sucede lo mismo con la tercera, 
por lo que (3, 4, —2) no es una solución del sistema. Observe cómo se utilizan los parén- 
tesis cuando se realizan las sustituciones; su uso es muy recomendable para protegerse 
contra errores aritméticos. 


4. Cuando la segunda ecuación se remplaza por su suma con la primera ecuación multipli- 
cada por 3, el sistema se convierte en: 


2x1 —x2=h 
0=k+3h 


Si k + 3h es diferente de cero, el sistema no tiene solución. El sistema es consistente para 
cualesquiera valores de h y k que produzcan k + 3h = 0. 


1.2 | REDUCCIÓN POR FILAS Y FORMAS ESCALONADAS 


En esta sección se perfecciona el método de la sección 1.1 para obtener un nuevo algoritmo 
de reducción por filas que permitirá analizar cualquier sistema de ecuaciones lineales.! Las 
preguntas fundamentales de existencia y unicidad planteadas en la sección 1.1 podrán res- 
ponderse utilizando la primera parte del algoritmo. 

El algoritmo es aplicable a cualquier matriz, sin importar si esta se considera o no como 
la matriz aumentada de un sistema lineal. Así, la primera parte de esta sección se ocupa de 
una matriz rectangular arbitraria y empieza introduciendo dos importantes clases de matrices, 
que incluyen a las matrices “triangulares” de la sección 1.1. En las definiciones que siguen, 
una fila o columna distinta de cero (o no nula) de una matriz será una fila o columna que 
contenga al menos un elemento diferente de cero; una entrada principal de una fila se refiere 
a la entrada o el elemento diferente de cero que se encuentra más a la izquierda (en una fila 
distinta de cero). 


1 El algoritmo es una variante de lo que se conoce comúnmente como eliminación gaussiana. Un método de elimi- 
nación similar para sistemas lineales fue utilizado por matemáticos chinos en el año 250 a. C. El proceso era des- 
conocido en la cultura occidental hasta el siglo XIX, cuando el famoso matemático alemán, Carl Friedrich Gauss, 
lo descubrió. El ingeniero alemán, Wilhelm Jordan, dio a conocer el algoritmo en un libro sobre geodesia publicado 
en 1888. 


DEFINICIÓN 


TEOREMA 1 
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Una matriz rectangular está en forma escalonada (o forma escalonada por filas) si 
tiene las siguientes tres propiedades: 


1. Todas las diferentes de cero están arriba de las filas que solo contienen ceros. 


2. Cada entrada principal de una fila está en una columna a la derecha de la entrada 
principal de la fila superior. 


3. En una columna todas las entradas debajo de la entrada principal son ceros. 


Si una matriz de forma escalonada satisface las siguientes condiciones adicionales, en- 
tonces está en forma escalonada reducida (o forma escalonada reducida por filas): 


4. La entrada principal en cada fila diferente de cero es 1. 


5. Cada entrada principal 1 es la única entrada distinta de cero en su columna. 


Una matriz escalonada (o bien, una matriz escalonada reducida) está en forma de 
escalón (o en forma escalonada reducida, respectivamente). La propiedad 2 dice que las en- 
tradas principales forman un patrón escalonado (esto es, en forma de escalera) que avanza 
hacia abajo y hacia la derecha de la matriz. La propiedad 3 es una simple consecuencia de 
la propiedad 2, pero se incluyó para darle mayor énfasis. 

Las matrices “triangulares” de la sección 1.1, tales como 


2 =3 2 1 1 0 0 29 
0 1 —4 8 y 0 1 0 16 
0 0 0. 5/2 0 0 1 3 


están en forma escalonada. De hecho, la segunda matriz está en forma escalonada reducida. 
A continuación se presentan más ejemplos. 


EJEMPLO 1 Las siguientes matrices están en forma escalonada. Las entradas principales 
(m) pueden tener cualquier valor diferente de cero; las entradas con asterisco (*) pueden tener 
cualquier valor (incluyendo al cero). 


ooo 
OOonmna * 
o omin 
o ome 
DGO D:0 
ocoooomn 
O o o op 
ooon * 
o op xXx 
OEN * xx 
Ox *** 
O * XA 
m * * ** 
XA *** 


Las siguientes matrices están en forma escalonada reducida porque las entradas principales 
son números 1, y hay ceros abajo y arriba de cada entrada principal 1. 


ROTE O II O A O) 
0 1 e 0 0 0 1 0 0 x* x 0 x 
y 0 0 0 0 MOI O 

0 0 0 0 
0.0.0.0 0.0.0 0.0 1 * A 
0 0 0 0 0 0 0 O0 1 «œ 


Cualquier matriz distinta de cero puede reducirse por filas (es decir, transformarse 
mediante operaciones elementales de fila) para producir más de una matriz en forma escalo- 
nada, utilizando diferentes secuencias de operaciones de fila. Sin embargo, la forma escalona- 
da reducida que se obtiene a partir de una matriz es única. El siguiente teorema se demuestra 
en el apéndice A al final del libro. 


Unicidad de la forma escalonada reducida 


Cada matriz es equivalente por filas a una, y solo a una, matriz escalonada reducida. 
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DEFINICIÓN 


Si una matriz A es equivalente por filas a una matriz escalonada U, entonces U se llama 
una forma escalonada (o una forma escalonada por filas) de A; si U está en forma escalo- 
nada reducida, entonces U es la forma escalonada reducida de A. [La mayoría de los pro- 
gramas de matrices y de las calculadoras con capacidades para trabajar con matrices emplean 
la abreviatura RREF (por las siglas de reduced row echelon form) para referirse a la forma 
escalonada reducida por filas. Algunos utilizan REF (por las siglas de row echelon form) para 
designar la forma escalonada por filas]. 


Posiciones pivote 


Cuando las operaciones de fila sobre una matriz producen una forma escalonada, las opera- 
ciones de fila posteriores para obtener la forma escalonada reducida no cambian la posición 
de las entradas principales. Como la forma escalonada reducida es única, entonces las en- 
tradas principales siempre están en las mismas posiciones en cualquier forma escalonada 
obtenida a partir de una matriz dada. Esas entradas principales corresponden a los números 
1 principales de la forma escalonada reducida. 


Una posición pivote en una matriz A es una ubicación en A que corresponde a un 1 
principal en la forma escalonada reducida de A. Una columna pivote es una columna 
de A que contiene una posición pivote. 


En el ejemplo 1, los cuadrados (m) identifican las posiciones pivote. Muchos conceptos 
fundamentales en los primeros cuatro capítulos estarán relacionados de una u otra manera con 
las posiciones pivote en una matriz. 


EJEMPLO 2  Reduzca por filas la matriz A que se muestra a continuación hasta la forma 
escalonada, y localice las columnas pivote de A. 


0—3 -6 4 9 
Sh S23 1 
23 0 3-1 

1.4 5-9 —7 


A= 


SOLUCIÓN Utilice la misma estrategia básica de la sección 1.1. La entrada superior de la co- 
lumna diferente de cero más a la izquierda de la matriz es la primera posición pivote. En esta posi- 
ción debe colocarse una entrada diferente de cero, o pivote. Una buena opción es intercambiar 
las filas 1 y 4 (porque los cálculos mentales en el siguiente paso no implicarán fracciones). 


Pivote 
la sia 
-1-2-1 3 1 
23 0 3-1 
0-3-6 4 9 
t Columna pivote 
Cree ceros debajo del pivote, 1, sumando múltiplos de la primera fila a las filas inferiores, 
para así obtener la matriz (1) que se muestra a continuación. La posición pivote en la segunda 


fila debe estar tan a la izquierda como sea posible, es decir, en la segunda columna. Se elige 
el 2 en esta posición como el siguiente pivote. 


Pivote 
4| 5 -9 -7 
2 4 —6 —6 


5 10 -15 -15 a) 
3 6 4 9 


D O 0y 


t Siguiente columna pivote 
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Sume la fila 2 multiplicada por —5/2 a la fila 3, y sume la fila 2 multiplicada por 3/2 a la 
fila 4. 


1 4 5-9 -7 
0 2 4—6 —6 
0o 0 0 0 0 2) 
0.0 0-3 0 


La matriz en (2) es diferente de las que se incluyen en la sección 1.1. ¡No hay manera de crear 
una entrada principal en la columna 3! (No podemos emplear las filas 1 o 2 porque, al hacer- 
lo, se destruiría el arreglo escalonado de las entradas principales ya obtenidas). Sin embargo, 
si se intercambian las filas 3 y 4, se puede obtener una entrada principal en la columna 4. 


Pivote 
1 4 5 —9 |-7 E X ko xk 
f E £ Oo Forma general: 0 " i * 7 
0 0 0 —5< 0 + IOo 0 0 E 
0 0 0 0 0 0o 0 0 0 Ọ 


t+ + Columnas pivote 


La matriz está en forma escalonada y así revela que las columnas 1, 2 y 4 de A son columnas 
pivote. 


Posiciones pivote 


(3) 





A Columms pivote E 


Un pivote, como el que se muestra en el ejemplo 2, es un número distinto de cero en una 
posición pivote que se utiliza conforme se necesite crear ceros mediante operaciones de fila. 
Los pivotes en el ejemplo 2 fueron 1, 2 y —5. Observe que esos números no son los mismos 
que los elementos reales de A en las posiciones pivote indicadas en (3). 

Con el ejemplo 2 como guía, es posible describir un procedimiento eficiente para trans- 
formar una matriz en una matriz escalonada o escalonada reducida. El estudio cuidadoso y el 
dominio de este procedimiento rendirán valiosos frutos en este curso. 


Algoritmo de reducción por filas 


El algoritmo que sigue consta de cuatro pasos y produce una matriz en forma escalonada. 
Un quinto paso da por resultado una matriz en forma escalonada reducida. Demostraremos 
este algoritmo con un ejemplo. 


EJEMPLO 3 Aplique operaciones elementales de fila para transformar la siguiente ma- 
triz a la forma escalonada y, luego, a la forma escalonada reducida: 


0.3 -6 6 4 -3 
3 8—5 8 9 
3-9 12-9 6 15 


SOLUCIÓN 


PASO 1 


Se inicia con la columna diferente de cero del extremo izquierdo. Esta es una columna 
pivote. La posición pivote se ubica en la parte superior. 
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0.3 -6 6 4 -3 
3 = 8-35 8 9 
3-9 12 -9 6 15 
t Columna pivote 


PASO 2 


Seleccione como pivote una entrada diferente de cero en la columna pivote. Si es nece- 
sario, intercambie filas para mover esta entrada a la posición pivote. 


Intercambie a las filas 1 y 3. (O bien, también se podrían intercambiar las filas 1 y 2). 


Pivote 
3 Lo 12 —9 6 15 


3 —7 8—5 8 9 
0.3 -6 6 4 -5 


PASO 3 


Utilice operaciones de remplazo de filas para crear ceros en todas las posiciones ubi- 
cadas debajo del pivote. 


Como paso preliminar, se podría dividir la fila superior entre el pivote, 3. Pero con dos núme- 
ros 3 en la columna 1, esto es tan fácil como sumar la fila 1 multiplicada por —1 a la fila 2. 


Pivote 
3-9 12 -9 6. 15 


0.2. -4 4 2 -6 
0 3 -6 6 4 -3 


PASO 4 


Cubra (o ignore) la fila que contiene la posición pivote y cubra todas las filas, si las hay, 
por encima de esta. Aplique los pasos 1 a 3 a la submatriz restante. Repita el proceso 
hasta que no haya filas diferentes de cero por modificar. 


Con la fila 1 cubierta, el paso 1 muestra que la columna 2 es la próxima columna pivote; para 
el paso 2, seleccione como pivote la entrada “superior” en esa columna. 


Pivote 
3-9. 12 -9 6 15 
0 2-4 4 2 —6 
0 3 -6 6 4—5 


Siguiente columna pivote 


En el paso 3, se podría insertar un paso adicional de dividir la fila “superior” de la submatriz 
entre el pivote, 2. En vez de ello, se suma la fila “superior” multiplicada por —3/2 a la fila 
de abajo. Esto produce 


ESE 
0 2 -4 4 2—6 
0 0 0 O 1 4 


1.2 Reducción por filas y formas escalonadas 17 


Para el paso 4, cuando se cubre la fila que contiene la segunda posición pivote, se obtiene una 
nueva submatriz con una sola fila: 


CS 
O O 
0 


0 0. 0 1-4 
Ds Pivote 


Los pasos 1 a 3 no necesitan aplicarse para esta submatriz, pues ya se ha alcanzado una forma 
escalonada para la matriz completa. Si se desea la forma escalonada reducida, se efectúa un 
paso más. 


PASO 5 


Empezando con la posición pivote del extremo derecho y trabajando hacia arriba y 
hacia la izquierda, genere ceros arriba de cada pivote. Si un pivote no es 1, conviértalo 
en 1 mediante una operación de escalamiento. 


El pivote del extremo derecho está en la fila 3. Genere ceros sobre él, sumando múltiplos 
adecuados de la fila 3 a las filas 1 y 2. 


3 —9 12 —9 0 -—9 «Fila 1 + (-6) : fila 3 
0 2 —4 4 O —14 <— Fila 2 + (-2) : fila 3 
0 0 0 0 1 4 





El siguiente pivote se encuentra en la fila 2. Se escala esta fila dividiéndola entre el pivote. 


3-9 12-9 0 -9 
0 12 2 0-—7 <— Fila escalada por 3 
0 0 0 O 1 4 


Cree un cero en la columna 2 sumando la fila 2 multiplicada por 9 a la fila 1. 
3 0 —6 9 0 -72 <— Fila 1 + (9) * fila 2 


0 1-2 2 0 -—7 
0o 0 0 O I 4 


Finalmente, escale la fila 1 dividiéndola entre el pivote, 3. 
102 3 0 —24 <— Fila escalada por 3 


0 1-2 2 0 -7 
0 0 0 O I 4 


Esta es la forma escalonada reducida de la matriz original. E 


La combinación de los pasos 1 a 4 se conoce como fase progresiva del algoritmo de 
reducción por filas. El paso 5, que produce la única forma escalonada reducida, se conoce 
como fase regresiva. 


NOTA NUMÉRICA 





En el paso 2 que se describió antes, un programa computacional por lo general selec- 
ciona como pivote a la entrada en una columna que tenga el mayor valor absoluto. Esta 


estrategia, llamada pivoteo parcial, se utiliza porque reduce los errores de redondeo 
en los diversos cálculos. 
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Soluciones de sistemas lineales 


El algoritmo de reducción por filas conduce directamente a una descripción explícita del 
conjunto solución de un sistema lineal cuando se aplica a la matriz aumentada del sistema. 

Suponga, por ejemplo, que la matriz aumentada de un sistema lineal se transformó a la 
forma escalonada reducida equivalente 


1. 0-5 1 
0 1 1 4 
0.0 0. 0 


Existen tres variables porque la matriz aumentada tiene cuatro columnas. El sistema de 
ecuaciones asociado es 


X1 — 5x; = 1 
Xx+ x3=4 (4) 
0 =0 


Las variables xı y x2 correspondientes a las columnas pivote se conocen como variables bá- 
sicas?. La otra variable, x3, se denomina variable libre. 

Siempre que un sistema es consistente, como en (4), el conjunto solución se puede des- 
cribir explícitamente al despejar en el sistema de ecuaciones reducido las variables básicas 
en términos de las variables libres. Esta operación es posible porque la forma escalonada 
reducida coloca a cada variable básica en una y solo una ecuación. En (4), despeje xı de la 
primera ecuación y x de la segunda. (Ignore la tercera ecuación, ya que no ofrece restric- 
ciones sobre las variables). 


xi = 1 + 5x3 
X2 = 4 — X3 (5) 
x3 es libre 


El enunciado “x3 es libre” significa que existe libertad de elegir cualquier valor para x3. 
Una vez hecho esto, las fórmulas en (5) determinan los valores de x1 y x2. Por ejemplo, cuando 
x3 = 0, la solución es (1, 4, 0); cuando x3 = 1, la solución es (6, 3, 1). Cada asignación 
diferente de x3 determina una solución (distinta) del sistema, y cada solución del sistema 
está determinada por una asignación de x3. 


EJEMPLO 4 Encuentre la solución general del sistema lineal cuya matriz aumentada se 
redujo a 


1.6 2-535-2 -4 
0.0 2-8 -1 3 
0.0. 0 0 1 7 


SOLUCIÓN La matriz está en forma escalonada, pero se desea la forma escalonada reducida 
antes de despejar las variables. El siguiente paso es completar la reducción por filas. El sím- 
bolo — antes de una matriz indica que esta es equivalente por filas a la matriz anterior. 


1.6 2-5-2 -4 1 6 2—5 0 10 

0 0 2 -8 -1 3ļ~ļ|O0O O 2-8 0 10 

0 0 0 0 1 7 0 0 0 0 1 7 

1 6 2—5 0 10 1 6 0O 3 0 0 
=10 0 1-4 O 5|=0 O 1-4 0. 5 
0 0 0 1 7 0 0 0 0 1 7 


2 Algunos libros utilizan el término variables principales, ya que corresponden a las columnas que contienen entradas 
principales. 
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Existen cinco variables porque la matriz aumentada tiene seis columnas. Ahora el sistema 
asociado es 


x1 + Óx2 + 3x4 =0 
3 4X4 =5 (6) 
X5 = 7 


Las columnas pivote de la matriz son 1, 3 y 5, así que las variables básicas son x1, x3 y x5. Las 
variables restantes, x2 y x4, deben ser libres. Se despejan las variables básicas para obtener 
la solución general: 


X1 = —6x2 = 3x4 

Xx, es libre 

x3 = 5 + 4x4 (7) 
X4 es libre 


x5.="1 


Observe que el valor de xs ya estaba establecido por la tercera ecuación del sistema (6). E 


Descripciones paramétricas de conjuntos solución 


Las descripciones en (5) y (7) son descripciones paramétricas de conjuntos solución en los 
cuales las variables libres actúan como parámetros. Resolver un sistema significa encontrar 
una descripción paramétrica del conjunto solución o determinar que el conjunto solución está 
vacío. 

Siempre que un sistema sea consistente y tenga variables libres, el conjunto solución ten- 
drá muchas descripciones paramétricas. Por ejemplo, en el sistema (4), se puede sumar la ecua- 
ción 2 multiplicada por 5 a la ecuación 1 para obtener el sistema equivalente 


xı + 5x2 = 21 


Xx + x3 = 4 


Se podría tratar a x como un parámetro y despejar xı y x3 en términos de x7, y se tendría una 
descripción exacta del conjunto solución. Sin embargo, para ser consistentes, se establece 
la convención (arbitraria) de utilizar siempre las variables libres como parámetros para des- 
cribir un conjunto solución. (La sección de respuestas al final del libro también refleja esta 
convención). 

Cuando un sistema es inconsistente, el conjunto solución es un conjunto vacío, aun cuan- 
do el sistema tenga variables libres. En este caso, el conjunto solución no tiene representación 
paramétrica. 


Sustitución regresiva 


Considere el siguiente sistema, cuya matriz aumentada está en forma escalonada, pero no en 
forma escalonada reducida: 


xı — 7x2 + 2x3 — 5x4 + 8x5 = 10 
X2 — 3x3 + 3x4 + xs=-5 


Xa= x5= 4 


Un programa computacional resolvería este sistema mediante sustitución regresiva, en vez 
de calcular la forma escalonada reducida. Es decir, el programa despejaría x4 de la ecuación 
3 en términos de xs, y sustituiría la expresión para x4 en la ecuación 2; luego, despejaría x, de 
esta última, sustituiría las expresiones para x, y xa en la ecuación 1 y despejaría x;. 

Nuestro formato matricial para la fase regresiva de reducción por filas, el cual produce la 
forma escalonada reducida, tiene el mismo número de operaciones aritméticas que la sustitu- 
ción regresiva. Pero la disciplina del formato matricial reduce de forma sustancial los errores 
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posibles en los cálculos a mano. ¡La mejor estrategia es utilizar solamente la forma escalo- 
nada reducida para resolver un sistema! La Guía de estudio que acompaña a este libro ofrece 
varias sugerencias útiles para efectuar operaciones de fila de manera exacta y rápida. 


NOTA NUMÉRICA 





En general, la fase progresiva de reducción por filas es más larga que la fase regre- 
siva. Por lo regular, un algoritmo para resolver un sistema se mide en flops (u ope- 
raciones de punto flotante). Un flop es una operación aritmética (+, —, *, /) que se 
realiza sobre dos números reales de punto flotante.? Para una matriz de n x (n + 1), 


la reducción a la forma escalonada puede requerir 2n?/3 + n?/2 — 7n/6 flops (que 
es aproximadamente 2n?/3 flops cuando n es moderadamente grande, por ejemplo, 
n = 30). En contraste, una reducción adicional a la forma escalonada reducida nece- 
sita, a lo sumo, n? flops. 


Preguntas de existencia y unicidad 


Aunque una forma escalonada no reducida es una herramienta poco eficiente para resolver 
un sistema, esta forma es justamente el medio correcto para responder las dos preguntas fun- 
damentales planteadas en la sección 1.1. 


EJEMPLO 5 Determine la existencia y unicidad de las soluciones del sistema 


3x2 — 6x3 + 6x4 + 4x5 = —5 
3x1 — 7x2 + 8x3 — 5x4 + 8x5 = 9 
3x1 — 9x2 + 12x3 — 9x4 + 6x; = 15 


SOLUCIÓN La matriz aumentada de este sistema se redujo por filas en el ejemplo 3 a: 


3 —9 12 -9 6 15 
0 2-4 4 2—6 (8) 
0 0 0 0 1 4 


Las variables básicas son x1, x2 y x5; las variables libres son x3 y x4. No existe ninguna ecua- 
ción del tipo O = 1 que indique la inconsistencia del sistema, así que se podría emplear sus- 
titución regresiva para encontrar una solución. Pero en (8) ya es evidente la existencia de 
una solución. Además, la solución no es única porque hay variables libres. Cada diferente 
asignación de x3 y x4 determina una solución distinta. Por lo tanto, el sistema tiene un nú- 
mero infinito de soluciones. E 


Cuando un sistema está en forma escalonada y no contiene ecuaciones del tipo 0 = b, 
con b diferente de cero, entonces cada ecuación no nula tiene una variable básica con un 
coeficiente distinto de cero. Es posible que las variables básicas estén completamente de- 
terminadas (sin variables libres) o que al menos una de las variables básicas pueda expresarse 
en términos de una o más variables libres. En el primer caso, existe una solución única; en el 
último caso, hay infinidad de soluciones (una para cada asignación de valores a las variables 
libres). 


3 Tradicionalmente, un flop era solo una multiplicación o división, ya que la suma y la resta tomaban mucho menos 
tiempo y podían ignorarse. Ahora se prefiere la definición de flop que aquí se presenta, debido a los avances en la 
arquitectura computacional. Véase Golub y Van Loan, Matrix Computations, 2a. ed. (Baltimore: The Johns Hopkins 
Press, 1989), pp. 19-20. 


1.2 


EJERCICIOS 


TEOREMA 2 
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Esas observaciones justifican el siguiente teorema. 


Teorema de existencia y unicidad 


Un sistema lineal es consistente si y solo si la columna más a la derecha de la matriz 
aumentada no es una columna pivote, es decir, si y solo si una forma escalonada de 
la matriz aumentada no tiene filas del tipo 


[0 --- O b] conb diferente de cero 


Si un sistema lineal es consistente, entonces el conjunto solución contiene: i. una única 
solución, cuando no existen variables libres, o ii. una infinidad de soluciones, cuando 
hay al menos una variable libre. 


El siguiente procedimiento indica cómo encontrar y describir todas las soluciones de un 
sistema lineal. 


USO DE LA REDUCCIÓN POR FILAS PARA RESOLVER UN SISTEMA LINEAL 


1. 
2. 


Escriba la matriz aumentada del sistema. 


Emplee el algoritmo de reducción por filas para obtener una matriz aumentada 
equivalente en forma escalonada. Determine si el sistema es consistente o no. Si no 
existe solución, deténgase; en caso contrario, continúe con el siguiente paso. 


Prosiga con la reducción por filas para obtener la forma escalonada reducida. 


Escriba el sistema de ecuaciones correspondiente a la matriz obtenida en el 
paso 3. 


Rescriba cada ecuación no nula del paso 4 de manera que su única variable básica 
se exprese en términos de cualquiera de las variables libres que aparecen en la 
ecuación. 


PROBLEMAS DE PRÁCTICA 


1. Encuentre la solución general del sistema lineal cuya matriz aumentada es 


1-3 -5 0 
0. 1 1 3 


2. Obtenga la solución general del sistema 


xı — 2x2 — x3+3x4=0 
—2x1 + 4x2 + 5x3 — 5x4 = 3 
3x1 — 6x2 — 6x3 + 8x4 = 2 


En los ejercicios 1 y 2, determine cuáles matrices están en forma es- 
calonada reducida y cuáles se encuentran solo en forma escalonada. 


1. a) 


1 
0 
0 


0 
1 
0 


0 
0 
1 


0 
0 
1 


b) 


1 
0 
0 


0 0 1 


0. 10 E 
1 1 0 al 


O G O m= 
O O Dm 
ocooo 
OU DN 
UN 


o 
D Om © 
oo=-—o 
o 
(E 
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1 0 1 1 1 0 0 0 
2. a)| O 1 1 1 bjo 2 Ọ0 
0.0 0.0 0 0 1 1 
0o 0 0.0 
ò 1.2.0.0 
0. 0 1-0 
0. 0 0. 1 
0 1 1 1 1 
0 0. 1 1 1 
a) 0.0 0.0 1 
o 0 0 0 0 


En los ejercicios 3 y 4 aplique la reducción por filas a las matrices 
para llevarlas a la forma escalonada reducida. En las matrices origi- 
nal y final encierre en un círculo las posiciones pivote, e indique las 
columnas pivote. 


1 2 4 8 1 2 4 5 
3.12 4 6 8 412 4 5 4 
3 6 9 12 4 5 4 2 


5. Describa las posibles formas escalonadas de una matriz 
de 2 x 2 diferente de cero. Utilice los símbolos m, * y 0, como 
en la primera parte del ejemplo 1. 


6. Repita el ejercicio 5 para una matriz de 3 x 2 diferente de 
cero. 


Encuentre las soluciones generales de los sistemas cuyas matrices 
aumentadas se presentan en los ejercicios 7 a 14. 


1 3 4 7 1-3 0-5 
q i; 9 7 i x E 7 0 > 


0. 1-2 3 1-2 -1 4 
a [i -3 4 al ns E 4 -5 e] 


322.40 013 0-1 
11. |9 —6 12 0 12. 
a o 0 0 1-7 
T 0 0 0 0 1 
fo 3 0-1 0-2 
0. 1.0 0-4 1 
Balog: aoe a E A 
Lo o 0 0 0 0 
fo 0-5 0 -8 3 
O 1 4-1 0 6 
Mo: vos 00 007 E g 
Lo o 0 0 0 0 


Los ejercicios 15 y 16 emplean la notación del ejemplo 1 para ma- 
trices en forma escalonada. Suponga que cada matriz representa la 
matriz aumentada para un sistema de ecuaciones lineales. En cada 
caso, determine si el sistema es consistente. De ser así, determine si 
la solución es única. 


E * * * 
15. a) 0 E * * 
0 (0) 0 0 
0 E * * 
bo B * * 
0 0 0 m 0 


. x * 
16. a) | 0 BE x 
0 0 
E x * * * 
blo 0 E * * 
(0) 0 0 E * 


En los ejercicios 17 y 18, determine el valor o los valores de h tales 
que la matriz sea la matriz aumentada de un sistema lineal consis- 


tente. 
l-1 4 1-3 1 
AEE dls actos] 


En los ejercicios 19 y 20, asigne valores para h y k de manera que 


el sistema a) no tenga solución, b) tenga solución única, y c) tenga 
muchas soluciones. Dé respuestas por separado para cada inciso. 


19. Xı + hx =2 20. 
4x1 + 8x2 =k 


xı — 3x2 = 1 
2x1 +hx»=k 


En los ejercicios 21 y 22, marque cada enunciado como verdadero o 
falso. Justifique cada respuesta.* 


21. a) En algunos casos, una matriz se puede reducir por filas a 
más de una matriz en forma escalonada reducida, median- 
te diferentes secuencias de operaciones de fila. 


b) El algoritmo de reducción por filas solamente se aplica a 
matrices aumentadas para un sistema lineal. 


c) En un sistema lineal una variable básica es una variable que 
corresponde a una columna pivote en la matriz de coefi- 
cientes. 


d) Encontrar una descripción paramétrica del conjunto solución 
de un sistema lineal es lo mismo que resolver el sistema. 


e) Si una fila en una forma escalonada de una matriz aumen- 
tada es [0 O O 5 O], entonces el sistema lineal asociado es 
inconsistente. 


22. a) La forma escalonada reducida de una matriz es única. 


b) Si cada columna de una matriz aumentada contiene un pivo- 
te, entonces el sistema correspondiente es consistente. 


c) Las posiciones pivote en una matriz dependen de si se utili- 
zan o no intercambios de filas en el proceso de reducción por 
filas. 


d) Una solución general de un sistema es una descripción explí- 
cita de todas las soluciones del sistema. 


e) Si un sistema tiene variables libres, entonces el conjunto so- 
lución contiene muchas soluciones. 


23. Suponga que la matriz coeficiente de un sistema lineal de cua- 
tro ecuaciones con cuatro variables tiene un pivote en cada co- 
lumna. Explique por qué el sistema tiene solución única. 


24. Suponga que un sistema de ecuaciones lineales tiene una matriz 
aumentada de 3 x 5 cuya quinta columna no es una columna 
pivote. ¿El sistema es consistente? ¿Por qué? 


4 Preguntas de verdadero/falso de este tipo se presentarán en muchas seccio- 
nes. Antes de los ejercicios 23 y 24 de la sección 1.1, se describieron algunos 
métodos para justificar las respuestas. 


25. Suponga que la matriz coeficiente de un sistema de ecuacio- 
nes lineales tiene una posición pivote en cada fila. Explique 
por qué el sistema es consistente. 


26. Suponga que una matriz de coeficientes de 3 x 5 para un sis- 
tema tiene tres columnas pivote. ¿El sistema es consistente? 
¿Por qué? 


27. Restructure la última frase del teorema 2 empleando el concepto 
de columnas pivote: “Si un sistema lineal es consistente, enton- 
ces la solución es única si y solo si A 


28. En una matriz aumentada, ¿qué se necesita saber acerca de las 
columnas pivote para determinar que el sistema lineal es consis- 
tente y tiene una solución única? 


29. Un sistema de ecuaciones lineales con menos ecuaciones que 
incógnitas se conoce como sistema subdeterminado. ¿Tal siste- 
ma puede tener una solución única? Explique su respuesta. 


30. Dé un ejemplo de un sistema subdeterminado inconsistente de 
dos ecuaciones con tres incógnitas. 


31. Un sistema de ecuaciones lineales con más ecuaciones que in- 
cógnitas se llama sistema sobredeterminado. ¿Tal sistema puede 
ser consistente? Ilustre su respuesta con un sistema específico 
de tres ecuaciones con dos incógnitas. 


32. Considere que una matriz de n x (n + 1) se simplifica por fi- 
las a su forma escalonada reducida. Aproximadamente, ¿qué 
fracción del número total de operaciones (flops) está impli- 
cada en la fase regresiva de la reducción cuando n = 20? 
¿Y cuando n = 200? 


Suponga que los datos experimentales están representados por un 
conjunto de puntos en el plano. Un polinomio de interpolación para 
los datos es un polinomio cuya gráfica pasa por todos los puntos. 


1.2 Reducción por filas y formas escalonadas 23 


En el ámbito científico, dicho polinomio se utiliza, por ejemplo, para 
estimar valores entre los puntos de datos conocidos. Otro uso es en 
la creación de curvas para imágenes gráficas en el monitor de las 
computadoras. Un método para construir un polinomio de interpo- 
lación consiste en resolver un sistema de ecuaciones lineales. 


33. Encuentre el polinomio de interpolación p(t) = ay + art + at? 
para los datos (1, 6), (2, 15), (3, 28). Es decir, determine ao, a1 
y a) tales que 


a +a(l)+a(1= 6 
do + a1(2) + a,(Q) = 15 
ay + a1(3) + a2(3) = 28 


34. [M] En un experimento de túnel de viento, la fuerza sobre un 
proyectil debido a la resistencia del aire se midió a diferentes 
velocidades: 


Velocidad (100 ft/seg) 0 2 4 6 8 10 


Fuerza (100 1b) O 290 148 396 743 119 


Encuentre un polinomio de interpolación para estos datos y 
estime la fuerza sobre el proyectil si este viaja a 750 ft/seg. 
Utilice p(t) = ao + aıt + axt? + a3? + ast + ast’. ¿Qué ocurre 
si usted intenta emplear un polinomio de menor grado que 5? 
(Por ejemplo, intente un polinomio cúbico).5 


5 Los ejercicios marcados con el símbolo [M] deben trabajarse con la ayuda 
de un “programa de matrices” (esto es, un programa computacional, como 
MATLAB®, Maple™, Mathematica®, MathCad® o Derive™, o una calcu- 
ladora programable con capacidades matriciales, como las fabricadas por Texas 
Instruments o Hewlett-Packard). 


> 


La solución general del sistema 
de ecuaciones es la recta de 
intersección de los dos planos. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. La forma escalonada reducida de la matriz aumentada y el sistema correspondiente son 
la 0 -2 | xa  —2x3=9 
Y FA E 
Las variables básicas son x¡ y x2, y la solución general es 


xı = 9 + 2x3 
X2 = 3 — X3 


x3 es libre 


Nota: Es esencial que la solución general describa a cada variable, con cualquier parámetro 
claramente definido. El siguiente enunciado no describe la solución: 


xı = 9 + 2x3 
X2 = 3— X3 
x3 = 3— x2 Solución incorrecta 


Esta descripción implica que tanto x) como x3 son libres, lo que desde luego no es el caso. 
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2. La matriz aumentada del sistema se reduce por filas: 


1-2-1 3 0 1-2-1 3 0 
2.4 5-5 3[=|0 0 3 1 3 
3-66 8 2 0. 0-3-1 2 
1-2-1 3 0 

~ 0 1 3 

0.00. 0 0 5 


Esta matriz escalonada indica que el sistema es inconsistente, porque su columna del ex- 
tremo derecho es una columna pivote; la tercera fila corresponde a la ecuación O = 5. No hay 
necesidad de realizar más operaciones de fila. Observe que en este problema es irrelevante 
la presencia de las variables libres porque el sistema es inconsistente. 


1.3 | ECUACIONES VECTORIALES 


Importantes propiedades de sistemas lineales se pueden describir mediante el concepto y la 
notación de vectores. Esta sección relaciona ecuaciones vectoriales con sistemas ordinarios 
de ecuaciones. El término vector aparece en una variedad de contextos matemáticos y físicos, 
los cuales se analizarán en el capítulo 4, “Espacios vectoriales”. Por ahora, vector significará 
una lista ordenada de números. Esta idea sencilla permite realizar, de manera rápida, intere- 
santes e importantes aplicaciones. 


Vectores en R? 


Una matriz con una sola columna es un vector columna, o simplemente un vector. Ejemplos 
de vectores con dos entradas son 


“Ll ll E 


donde w;, y w, son números reales. R? (léase “erre dos”) denota el conjunto de todos los vec- 
tores con dos entradas. La R representa los números reales que aparecen como entradas en 
los vectores, y el exponente 2 indica que cada vector contiene dos entradas.' 

Dos vectores en R? son iguales si y solo si sus entradas correspondientes son iguales. 


Así, [$] y | A no son iguales, porque los vectores en R? son pares ordenados de números 


reales. 
Dados dos vectores u y v en R?, su suma es el vector u + v, que se obtiene al sumar 
las entradas correspondientes de u y v. Por ejemplo, 


aR 


Considerando un vector u y un número real c, el múltiplo escalar de u por c es el vector cu, 
que se obtiene al multiplicar por c cada entrada en u. Por ejemplo, 


i u= A =5 t cu=5 A de 
si ij y c f entonces =5 l= 


1 La mayor parte del libro se refiere a vectores y matrices que solo tienen entradas reales. Sin embargo, todas las 
definiciones y los teoremas en los capítulos 1 a 5, y en la mayor parte del resto del libro, conservan su validez si 
las entradas son números complejos. Vectores y matrices complejos surgen de manera natural en áreas como física 
e ingeniería eléctrica. 
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El número c en cu se llama escalar; se escribe en cursivas, y no en negritas, para así distin- 
guirlo del vector u. 

Es posible combinar las operaciones de multiplicación por un escalar y suma vectorial, 
como en el siguiente ejemplo. 


EJEMPLO 1 A partir de u = E yv= E encuentre 4u, (—3)v, y 4u + (—3)v. 
SOLUCIÓN 
4 —6 
old ela 
y 


4 —6 —2 
cor [5 +15 =[3] = 
Algunas veces, por conveniencia (y también para ahorrar espacio), en este libro se de- 


3 
nota un vector columna como E | en la forma (3, — 1). En este caso, los paréntesis y la 


coma distinguen al vector (3, — 1) de la matriz fila 1 x 2 [3 —1], que se representa con cor- 


chetes y sin coma. Así, 
3 
porque las matrices tienen diferentes formas, aunque las entradas sean iguales. 


Descripciones geométricas de R? 


Considere un sistema de coordenadas rectangulares en el plano. Como cada punto en el pla- 
no está determinado por un par ordenado de números, es posible identificar un punto geomé- 


a : ; 
trico (a, b) con el vector columna | b | Así, puede considerarse a R? como el conjunto de 


todos los puntos del plano. Véase la figura 1. 


(2, 2) (2, 2) 





(22, -1) (3,-1) (22,-1) (3, -1) 


FIGURA 1 Vectores como puntos. FIGURA 2 Vectores con flechas. 


3 
La visualización geométrica de un vector como E se facilita al incluir una flecha 


(un segmento de recta dirigido) desde el origen (0, 0) al punto (3, —1), como en la figura 2. 
En este caso, los puntos individuales a lo largo de la flecha carecen de significado especial.? 

La suma de dos vectores tiene una útil representación geométrica. La siguiente regla 
puede verificarse mediante geometría analítica. 


2 En física, las flechas representan fuerzas y, por lo general, son libres para moverse en el espacio. En la sección 4.1 
se analizará esta interpretación de vectores. 
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Regla del paralelogramo para la adición 


Si u y v en R? se representan como puntos en el plano, entonces u + v corresponde 
a un cuarto vértice del paralelogramo cuyos otros vértices son u, 0 y v. Véase la fi- 
gura 3. 


u+v 


ev 





0 1 


FIGURA 3 Regla del paralelogramo. 


EJEMPLO 2 Los vectores u = |; e= le yu+y= El se muestran en la 








2 1 
figura 4. E 
X; 
+ 
u+v 3L 
Siz eu 
ve + 
tt HH Xx; 
-6 2 
FIGURA 4 


El siguiente ejemplo ilustra el hecho de que el conjunto de todos los múltiplos escalares 
de un vector diferente de cero (también llamado no nulo), fijo, es una recta que pasa por el 
origen, (0, 0). 


EJEMPLO 3 Sea u = | 


1 | En una gráfica muestre los vectores u, 2u y iu. 


SOLUCIÓN Observe la figura 5, donde se indican u, 2u = | 2] y —u = E | La fle- 


cha para 2u es el doble de largo que la flecha para u, y las flechas apuntan en el mismo 
sentido. La flecha para —u es dos tercios de la longitud de la flecha para u, y las flechas 
apuntan en sentidos opuestos. En general, la longitud de la flecha para cu es |c| veces la 


0u 








X Xi 


2u 


Múltiplos típicos de u 
FIGURA 5 


Conjunto de todos los múltiplos de u 


Xi 


FIGURA 6 
Múltiplos escalares. 


ev 





FIGURA 7 
Resta vectorial. 
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longitud de la flecha para u. [Recuerde que la longitud del segmento de línea de (0, 0) a (a, b) 
es Va? + b?. Esto se analizará en el capítulo 6]. E 


Vectores en R? 


Los vectores en R? son matrices columna de 3 x 1 con tres entradas. Se representan geo- 
métricamente mediante puntos en un espacio coordenado tridimensional; algunas veces se 
2 
incluyen flechas desde el origen para dar una mayor claridad visual. Los vectores a = | 3 
4 
y 2a se muestran en la figura 6. 


Vectores en R” 


Si n es un entero positivo, R” (léase “erre ene”) denota la colección de todas las listas (o n-adas 
ordenadas) de n números reales, generalmente escritas como matrices columna de n x 1 del 
tipo 


41 


El vector cuyas entradas son todas cero se llama vector cero y se denota con 0. (El nú- 
mero de entradas en O será evidente a partir del contexto). 

La igualdad de vectores en R” y las operaciones de multiplicación escalar y suma vecto- 
rial en [R” se definen entrada por entrada como en R?. Esas operaciones sobre vectores tienen 
las siguientes propiedades, las cuales pueden verificarse directamente a partir de las propieda- 
des correspondientes de los números reales. Véase el problema de práctica 1 y los ejercicios 
33 y 34 al final de esta sección. 


Propiedades algebraicas de R” 


Para todo u, v, w en R” y para todos los escalares c y d: 


iu+tv=sv+u v. cu + v)=cu+cv 
ii. (u + v)+w=u + (v +w) vi. (c + d)u = cu + du 
iiiu +0=0+u=su vii. c(du) = (cd )\(u) 

iv. u + (—u) = —u + u = 0, viii. lu = u 


donde —u denota (—1)u 


Para simplificar la notación, un vector del tipo u + (—1)v con frecuencia se escribe como 
u — v. La figura 7 muestra a u — v como la suma de u y —v. 


Combinaciones lineales 


Dados los vectores V1, V2,..., Vp en R” y dados los escalares c1, C2,..., Cp, el vector y definido 
por 


y = C1V1 +: + CpYp 


se llama combinación lineal de v;,..., V, con pesos c1,..., Cp. La propiedad ii anterior nos 
permite omitir los paréntesis al formar la combinación lineal. Los pesos en una combinación 
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FIGURA 9 


lineal pueden ser cualesquiera números reales, incluyendo el cero. Por ejemplo, algunas com- 
binaciones lineales de los vectores v; y va son 


13 v; + v2, ivi (= ivi +0v2) y 0(= 0v; + 0v2) 


-1 
EJEMPLO 4 La figura 8 identifica combinaciones lineales seleccionadas de vı = | 1 | 


2 
y Va = | 1 | (Observe que los conjuntos de líneas paralelas de la rejilla están trazados me- 


diante múltiplos enteros de vı y v2). Estime las combinaciones lineales de vı y v2 que generan 
los vectores u y w. 


3 
5t 3y 


2v3 


AA +V, 
1 


-2v, 


| 
| 
| 
| 
| 
| 
1 
| 
| 
| 
| -2v 
| 

l 


FIGURA 8 Combinaciones lineales de vı y v2. 


SOLUCIÓN La regla del paralelogramo indica que u es la suma de 3v, y —2v; es decir, 
u = 3v; — 2v7 


Esta expresión para u se puede interpretar como las instrucciones para desplazarse desde el 
origen a u por dos trayectorias rectas. Primero, desplácese 3 unidades en la dirección de v; ha- 
cia 3v;, y luego avance —2 unidades en la dirección de va (paralela a la recta que pasa por va y 
0). Después, aunque el vector w no está sobre una línea de la rejilla, w parece estar a la mitad 
del camino entre dos pares de rectas de la rejilla, en el vértice de un paralelogramo determi- 
nado por (5/2)v, y (—1/2)v>. (Véase la figura 9). Así, una estimación razonable de w es 


5 1 
W= 3V1— 32 E 


El siguiente ejemplo relaciona un problema sobre combinaciones lineales con la pregun- 
ta fundamental de existencia que se estudió en las secciones 1.1 y 1.2. 


1 2 7 
EJEMPLO 5 Sean a; = | -—2|,a2=|5|yb= 4 |. Determine si b se puede 
—5 6 —3 


generar (o escribir) como una combinación lineal de a, y a. Es decir, determine si existen 
pesos x1 y x2 tales que 


X1aı + xa = b (1) 
Si la ecuación vectorial (1) tiene solución, encuéntrela. 


SOLUCIÓN Aplique las definiciones de multiplicación escalar y suma vectorial para rescri- 
bir la ecuación vectorial 


II 
>N 


xa|-2|+x 


b 
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que es lo mismo que 


X1 2x2 7 
—2x; | +| 5x2 | = 4 
—5X1 6x2 —3 
y 
xı + 2x2 7 
-2x + 5x2 |=| 4 (2) 
—5x1 + 6x> —3 


Los vectores en los miembros izquierdo y derecho de (2) son iguales si y solo si sus entradas 
correspondientes son iguales. Es decir, x¡ y x2 hacen válida la ecuación vectorial (1) si y solo 
si xı y x2 satisfacen el sistema 
x+2x= 7 
—2x1+5x= 4 (3) 
—5x1 + 6x2 = -3 


Para resolver este sistema, se reduce por filas la matriz aumentada del sistema como 
sigue:? 


11.2 7 1 2 7 L 2 “7 1 0 3 
2 5 4|=|0 9 18|=]0 1 2|=]0 1 2 
=5 6 -3 0 16 32 0 16 32 o 0 0 


La solución de (3) es xı = 3 y x2 = 2. Así que b es una combinación lineal de a; y a2, con 
pesos xı = 3 y x2 = 2. Es decir, 


1 2 T 
3| -2 | +2| 5| = 4 E 
=5 6 3 


Observe en el ejemplo 5 que los vectores originales a,, az y b son las columnas de la 
matriz aumentada reducida por filas: 


1 Ze T7 
—2 5 4 
=5 6 -3 

A 
aj a b 


Por brevedad, se escribe esta matriz en una forma que identifique sus columnas, a saber, 
[a; a2 b] (4) 


De la ecuación vectorial (1) es claro cómo escribir esta matriz aumentada, sin realizar los 
pasos intermedios del ejemplo 5. Tome los vectores en el orden en que aparecen en (1) y 
colóquelos en las columnas de una matriz como en (4). 

El análisis anterior puede modificarse fácilmente para establecer el siguiente hecho fun- 
damental. 


Una ecuación vectorial 
xia + x282 + © + xran = b 
tiene el mismo conjunto solución que el sistema lineal cuya matriz aumentada es 
[lai a2 © a, b] (5) 


En particular, b se puede generar por una combinación lineal de a;,..., a, si y solo 
si existe una solución al sistema lineal correspondiente a la matriz (5). 


3 El símbolo — entre matrices denota equivalencia de filas (sección 1.2). 
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DEFINICIÓN 


Una de las ideas fundamentales en álgebra lineal es el estudio del conjunto de todos los 
vectores que se pueden generar o escribir como una combinación lineal de un conjunto fijo 
[v1,..., vp) de vectores. 


Si vı,..., Vp están en R”, entonces el conjunto de todas las combinaciones lineales de 
V1,..., Vp Se denota como Gen (y1,..., Vp} y se llama el subconjunto de R” extendido 
o generado por v1,..., Vp. Es decir, Gen {v1,..., Vp} es el conjunto de todos los vectores 
que se pueden escribir en la forma 


C1V1 + C2V2 CY 


con escalares Cj,..., Cp. 


Preguntar si un vector b está en Gen (v;,..., v») equivale a preguntar si la ecuación 
vectorial 


X1V1 + xv E XpÝp 7 b 


tiene una solución o, de manera equivalente, si el sistema lineal con la matriz aumentada 


[vi = Vp b] tiene una solución. 
Observe que Gen (v;,..., V») contiene a cada múltiplo escalar de vı (por ejemplo), 
ya que cv; = cv; + Ov2 + =- + Ov,. En particular, el vector cero debe estar en Gen 


{V Vp}. 


Descripción geométrica de Gen {v} y de Gen {u, v} 


Sea v un vector diferente de cero en R?. Entonces Gen {v} es el conjunto de todos los múl- 
tiplos escalares de v, que es el conjunto de puntos sobre la recta en R? que pasa por v y 0. 
Véase la figura 10. 

Si u y v son vectores diferentes de cero en R?, y v no es un múltiplo de u, entonces 
Gen {u, v} es el plano en R? que contiene a u, v y 0. En particular, Gen {u, v} contiene la 
recta en R? que pasa por u y 0, y la recta que pasa por v y 0. Véase la figura 11. 


EY 
A 
A 
JAE 


FIGURA 10 Gen {v} como una recta FIGURA 11 Gen {u, v} como 
que pasa por el origen. un plano que pasa por el origen. 
1 5 —3 
EJEMPLO 6 Sean a; = | —2 |, a = | —13 | y b = 8 |. Entonces Gen (aj, a2} 
3 -3 1 


es un plano que pasa por el origen en R?. ¿Está b en ese plano? 
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SOLUCIÓN ¿Tiene solución la ecuación xa; + x2a2 = b? Para responder a esto, reduzca 
por filas la matriz aumentada [a] a b]: 


1 5 -—3 1 Sa 3 1 ES 

2-13 8|=¡0 -3 2|=|0 3 2 

3 3 1 0 —18 10 0 0 -—2 
La tercera ecuación es O = —2, la cual muestra que el sistema no tiene solución. La ecuación 
vectorial x¡a¡ + x2a27 = b no tiene solución, de manera que b no está en Gen {a;, a2}. E 


Combinaciones lineales en aplicaciones 


El ejemplo final muestra cómo surgen múltiplos escalares y combinaciones lineales cuando 
una cantidad, como el “costo”, se descompone en varias categorías. El principio básico en 
este ejemplo concierne al costo de fabricar varias unidades de un producto cuando se conoce 


el costo por unidad: 
número |. costo _ [costo 
de unidades] |porunidad/ — | total 


EJEMPLO 7 Una empresa fabrica dos productos. Para obtener $1.00 del producto B, la 
empresa gasta $0.45 en materiales, $0.25 en mano de obra y $0.15 por concepto de costos 
indirectos. Para obtener $1.00 del producto C, la empresa gasta $0.40 en materiales, $0.30 
en mano de obra y $0.15 en costos indirectos. Sean 


45 40 
b=|.25| y e= | 30 
15 15 


Entonces b y c representan los “costos por dólar de ingreso” para los dos productos. 


a) ¿Qué interpretación económica puede darse al vector 100b? 

b) Suponga que la empresa desea fabricar x¡ dólares del producto B y x> dólares del produc- 
to C. Dé un vector que describa los diversos costos que tendrá que enfrentar la empresa 
(por materiales, mano de obra y gastos indirectos). 


SOLUCIÓN 
a) Calcule 
AS 45 
100b = 100| .25 | =| 25 
.15 15 


El vector 100b lista los diversos costos para producir $100 del producto B, a saber, $45 
por materiales, $25 por mano de obra y $15 por gastos indirectos. 


b) Los costos de fabricación de xı dólares del producto B están dados por el vector xıb, y los 
costos para manufacturar xz dólares del producto C están dados por x,c. Así que los cos- 
tos totales para ambos productos están dados por el vector x¡b + x,c. E 


PROBLEMAS DE PRÁCTICA 


1. Demuestre que u + v = v + u para cualesquiera u y v en R”. 
2. Obtenga el valor o los valores de h para que y esté en Gen {v1, V2, V3} si 
1 5 —3 —4 


vy=|- 1], v = | —4 l, v3 = 1 y y= 3 
—2 —7 0 h 
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1.3 EJERCICIOS 


En los ejercicios 1 y 2, calcule u + v y u — 2v. 


Las [fr 3] [3] 


En los ejercicios 3 y 4, muestre los siguientes vectores utilizando 
flechas en una gráfica xy: u, v, — v, —2v, u + v, u — v y u — 2y. 
Observe que u — v es el vértice de un paralelogramo cuyos otros 
vértices son u, 0 y —v. 

3. uyvcomoen el ejercicio 1 4. uy v como en el ejercicio 2 


En los ejercicios 5 y 6, escriba un sistema de ecuaciones que sea 
equivalente a la ecuación vectorial dada. 


3 5 2 
5. x|-2|+x| 0|=|-3 
8 —9 8 


(Tele 


Utilice la figura adjunta para escribir cada vector listado en los 
ejercicios 7 y 8 como una combinación lineal de u y v. ¿Cada vec- 
tor en R? es una combinación lineal de u y v? 


-2v 


7. Vectores a,b, c yd 
8. Vectores w, X, y y Z 


En los ejercicios 9 y 10, escriba una ecuación vectorial que sea equi- 
valente al sistema de ecuaciones dado. 
9. X + 5x3 = 0 10. 
4xı + 6x2 — x; =0 
=X1 + 3x2 = 8x3 =0 


3x1 = 2x2 + 4x3 =3 
—2x1 a 1x2 + 5x3 
5x1 + 4x2 = 3x3 =2 


En los ejercicios 11 y 12, determine si b es una combinación lineal 
de aj, a» y as. 


1 5 2 

11. a = —2 E = 1 ,d3= —6 ,b = -1 
0 8 6 

1 —2 —6 11 

12. a = 0 , a2 = 3 , a3 = 7 ,b= =5 
1 —2 5 9 


En los ejercicios 13 y 14, determine si b es una combinación lineal de 
los vectores formados a partir de las columnas de la matriz A. 


1 —4 2 3 
13. A= 0 3 5|,b=|-—7 
—2 8 —4 =3 
1 5 
14 4A=|-2 1 -—6|,b=| -—1 
0 8 
1 -5 3 
15. Sean a = 3 |a = | —8 | y b= | —5 |. ¿Con qué 
-1 2 h 
valor (o valores) de h se encuentra b en el plano generado por a; 
y a2? 
1 -2 h 
16. Sean vı = 0 |,v= liyy=|-3 |. ¿Para qué 
=2 7 =5 


valor (o valores) de h se encuentra y en el plano generado por 
Vi y v2? 


En los ejercicios 17 y 18, liste cinco vectores en Gen {v1, V2}. Para 
cada vector, muestre los pesos sobre v; y vz empleados para generar 
el vector e indique las tres entradas de este. No realice bosquejos. 


3 =4 
17. v = 1 sV = 0 
2 1 

1 —2 

18. vV = 1 » Ya = 3 

-2 0 


19. Dé una descripción geométrica de Gen (vi, v2) para los vec- 


8 12 
tores V; = 2 |yv= 3 
—6 —9 


20. Realice una descripción geométrica de Gen {v1, V2} para los 
vectores del ejercicio 18. 


21. Sean u = sl y v= a Demuestre que p está en 


Gen (u, v) para todas las h y k. 


22. Construya una matriz A de 3 x 3, con entradas diferentes de 
cero, y un vector b en R? tal que b no esté en el conjunto gene- 
rado por las columnas de A. 


En los ejercicios 23 y 24, marque cada enunciado como falso o ver- 
dadero. Justifique sus respuestas. 


23. a) Otra notación para el vector | E 


4 
3 | es[-4 3]. 


-2 
b) Los puntos en el plano que corresponden a | al y 


-5 p : 
| ) | están sobre una recta que pasa por el origen. 


c) Un ejemplo de combinación lineal de los vectores vı y v2 
es el vector ivi. 


24. 


25. 


26. 


27. 


28. 


d) El conjunto solución del sistema lineal cuya matriz aumen- 
tada es [a; az az b] coincide con el conjunto solución de la 
ecuación xa; + x22)7 + x3a3 = b. 


e) El conjunto Gen (u, v) siempre se visualiza como un plano 
que pasa por el origen. 


a) Cuando u y v son vectores diferentes de cero, Gen (u, v) 
solo contiene la recta que pasa por u y por el origen, y la 
recta que pasa por v y el origen. 


b) Cualquier lista de cinco números reales es un vector en R5. 


c) Preguntar si el sistema lineal correspondiente a la matriz 
aumentada [a] a2 a3 b] tiene solución equivale a preguntar 
si el vector b está en Gen {a;, a2, a3}. 


d) El vector v resulta cuando un vector u — v se suma al vec- 
tor V. 


e) No todos los pesos c1,..., Cp en una combinación lineal 
C1V1 + *** + CpVp pueden ser cero. 


1 0 —4 
Sean A = 0 3 -2|yb= 1 |. Denote las co- 
—2 6 3 —4 


lumnas de A por a, a2, az, y sea W = Gen {a;, a2, a3}. 

a) ¿Está b en {a;, a2, a3}? ¿Cuántos vectores hay en (aj, a», 
az)? 

b) ¿Está b en W? ¿Cuántos vectores hay en W? 


c) Demuestre que a; está en W. [Sugerencia: Las operaciones 
de fila son innecesarias]. 


2 0 6 10 

Sean A= | -1 8 5ļj,b=]ļ| 3 | y sea Wel conjunto 
1 —2 1 1 

de todas las combinaciones lineales de las columnas de A. 


a) ¿Está b en W? 


b) Demuestre que la segunda columna de A está en W. 


Una compañía minera posee dos minas. En un día, la mina ++1 
produce mineral que contiene 30 toneladas métricas de cobre 
y 600 kilogramos de plata, mientras que, también en un día, 
la mina +2 produce mineral que contiene 40 toneladas métri- 


cas de cobre y 380 kilogramos de plata. Sean vı = o y 


vV = | 380 | Así, v¡ y V2 representan la “producción diaria” 
de la mina #1 y la mina +2, respectivamente. 
a) ¿Qué interpretación física puede darse al vector 5v1? 


b) Suponga que la compañía opera la mina +1 durante x¡ días y 
la mina +2 por x> días. Escriba una ecuación vectorial cuya 
solución dé el número de días que cada mina debería operar 
para producir 240 toneladas de cobre y 2824 kilogramos de 
plata. No resuelva la ecuación. 


c) [M] Resuelva la ecuación en b). 


Una planta eléctrica de vapor quema dos tipos de carbón: an- 
tracita (A) y bituminoso (B). Por cada tonelada de A que se 
quema, la planta produce 27.6 millones de Btu de calor, 3100 
gramos (g) de dióxido de sulfuro, y 250 g de contaminantes 
sólidos (partículas). Por cada tonelada de B que se quema, la 


29. 


30. 
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planta produce 30.2 millones de Btu, 6400 g de dióxido de sul- 
furo, y 360 g de contaminantes sólidos (partículas). 


a) ¿Cuánto calor produce la planta cuando quema xı toneladas 
de A y x2 toneladas de B? 


b) Suponga que la producción de la planta de vapor está des- 
crita por un vector que lista las cantidades de calor, dióxido 
de sulfuro y contaminantes sólidos. Exprese esta produc- 
ción como una combinación lineal de dos vectores, supo- 
niendo que la planta quema x; toneladas de A y x2 tonela- 
das de B. 


c) [M] Durante cierto tiempo, la planta de vapor produjo 162 
millones de Btu de calor, 23,610 g de dióxido de sulfuro y 
1623 g de contaminantes sólidos. Determine cuántas tonela- 
das de cada tipo debe haber quemado la planta. Como parte 
de la solución, incluya una ecuación vectorial. 


Sean vj,..., v¿ puntos en R? y suponga que para j = 1,..., kun 
objeto con masa m; está localizado en el punto vj. Los físicos 
llaman masas puntuales a esos objetos. La masa total del sis- 
tema de masas puntuales es 


m= m + + My 


El centro de gravedad (o centro de masa) del sistema es 
V= — [mvi +- + meyk] 
m 


Calcule el centro de gravedad del sistema que consiste en las 
siguientes masas puntuales (véase la figura): 


Punto Masa 
vı = (2, —2, 4) 4g 
v2 = (—4, 2, 3) 2g 
v3 = (4, 0, —2) 38 
v4 = (1, —6, 0) 5g 
X3 
vi Y 
a E 
0 
X | 
v3 Va X2 


Sea v el centro de masa de un sistema de masas puntuales 
localizadas en v1,..., V como en el ejercicio 29. ¿Está v en 
Gen {v1,..., Vg}? Explique su respuesta. 
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31. Una delgada placa triangular de densidad y grosor uniformes ¿Es única la solución? Utilice la figura para explicar sus 
tiene vértices en vı = (0, 1), v2 = (8, 1) y v3 = (2, 4), como respuestas. 
en la figura que aparece a continuación; la masa de la placa es 
de 3 g. % 
Xz v3 
Y 
4 => 
L Placa metálica vi 
L b 
e 
Y + Y x 
— i m y 
8 v 





a) Encuentre las coordenadas (x, y) del centro de masa de la 


placa. Este “punto de equilibrio” de la placa coincide con 33, Conlos vectores U = (41,..., Uy), V=(V1,..., Va) y W= (W1,..., Wp), 


el centro de masa de un sistema que consta de tres masas verifique las siguientes propiedades algebraicas de R”. 
tuales de 1 locad l értices de la placa. 
puntuales de 1 g colocadas en los vértices de la placa O Ww 


b) Determi ómo distribui dicional d 1 
) Determine cómo distribuir una masa adicional de 6 g en los b) c(u + y) =cu + ev para cada escalar e 


tres vértices de la placa para así mover su punto de equilibrio 
a (2,2). [Sugerencia: Sean w;, wz y w3 las masas agregadas a 34. Utilice el vector u = (u3,..., un) para verificar las siguientes 
los tres vértices, de manera que w; + w + w3 = 6]. propiedades algebraicas de R”. 


32. Considere los vectores V1, V2, V3 y b en R?, que se muestran en a) u + (~u) = (~u) +u =0 
la figura. ¿Tiene solución la ecuación x1V1 + x2V2 + x3v3 = b? b) c(du) = (cd)u para todos los escalares c y d 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Tome los vectores arbitrarios u = (4],..., Un) y V = (v],..., Un) en R”, y calcule 


u+v= (u1 + 01,..., Un + Un) Definición de suma vectorial 
= (vi F ui,..., Un + Un) Conmutatividad de la adición en R 
=v+u Definición de suma vectorial 
h=9 2. El vector y pertenece a Gen {v1, V2, V3} si y solo si existen escalares x1, x2, x3 tales que 
> 1 5 -3 —4 
2 
vi h=5 ` X1 —1 + Xa —4 | + X3 1 = 3 
Gen {Vv}, Vz V3} N 2 7 0 h 
h=1 Esta ecuación vectorial es equivalente a un sistema de tres ecuaciones lineales con tres 
incógnitas. Si la matriz aumentada de este sistema se reduce por filas, se encuentra que 
—4 1. 5-3 —4 1 5 -3 —4 1 5 -3 —4 
Los puntos 3 | están sobre 1-4 1 3|=1|0 1-2 —-1 =|0 Li) -1 
h -2 -7 O h 0 3-6 h-8 0 0 0 h=5 


la recta que se interseca con 


el plano cuando h = 5. Este sistema es consistente si y solo si no existe pivote en la cuarta columna. Es decir, 


h — 5 debe ser 0. Así, y está en Gen {v1, V2, V3} si y solo si h = 5. 


Recuerde: La presencia de una variable libre en un sistema no garantiza que este sea 
consistente. 


1.4 | ECUACIÓN MATRICIAL Ax = b 


Una idea fundamental en álgebra lineal consiste en ver una combinación lineal de vectores 
como el producto de una matriz y un vector. La siguiente definición permite reformular algu- 
nos de los conceptos de la sección 1.3 desde nuevos puntos de vista. 


DEFINICIÓN 
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Si A es una matriz de m x n, con columnas a;,..., an, y si x está en R”, entonces el 
producto de A y x, denotado como Ax, es la combinación lineal de las columnas de 
A utilizando como pesos las entradas correspondientes en x; es decir, 


X] 


Ax=(ag a “a | 91 + 199) + + + x,2 
1 2 n e] 267 ntn 





Xn 


Observe que Ax está definido solamente si el número de columnas de A es igual al número 
de entradas en x. 


EJEMPLO 1 
4 
1 2-1 1 —1 
aee A P 
4 
0 
2 —3 8 —21 —13 
0 
2 


2 310, 
bles 0 | [a 8 =| 32 |+| o|=]| 32 E 
= —20 14 —6 


EJEMPLO 2 Para vı, v2, v3 en R”, escriba la combinación lineal 3v; — 5v2 + 7v3 como 
una matriz por un vector. 


SOLUCIÓN Coloque v1, V2, V3 en las columnas de una matriz A y coloque los pesos 3, —5 
y 7 en un vector x. Es decir, 


3 
3v — 5v2 + 7v3 = |v v v]| —5 | = Ax E 
7 


La sección 1.3 mostró cómo escribir un sistema de ecuaciones lineales como una ecua- 
ción vectorial que implica una combinación lineal de vectores. Por ejemplo, el sistema 


xi +2x2 — x3=4 
—5x2 + 3x3 = 1 


la o 


Como en el ejemplo 2, la combinación lineal en el lado izquierdo es una matriz por un vector, 
de manera que (2) se convierte en 


2 e 4 
o lle |=L o 
X3 

La ecuación (3) tiene la forma Ax = b. Tal ecuación se llama ecuación matricial, para 

distinguirla de una ecuación vectorial como la que se muestra en (2). 
Observe cómo la matriz en (3) es justamente la matriz de coeficientes del sistema (1). 
Cálculos similares indican que cualquier sistema de ecuaciones lineales, o cualquier ecua- 
ción vectorial como (2), se puede escribir como una ecuación matricial equivalente en la for- 


ma Ax = b. Esta sencilla observación se utilizará de manera recurrente a lo largo del texto. 
A continuación se presenta el resultado formal. 


(1) 


es equivalente a 
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TEOREMA 3 


Si A es una matriz de m x n, con columnas aj,..., a,, y si b está en [R”, la ecuación 
matricial 


Ax =b (4) 
tiene el mismo conjunto solución que la ecuación vectorial 
x191 + 02) + *** + Xxydn = b (5) 


la cual, a la vez, tiene el mismo conjunto solución que el sistema de ecuaciones lineales 
cuya matriz aumentada es 


[la a e a, b] (6) 


El teorema 3 constituye una poderosa herramienta para comprender problemas de ál- 
gebra lineal, porque ahora un sistema de ecuaciones lineales puede verse en tres formas dife- 
rentes, pero equivalentes: como una ecuación matricial, como una ecuación vectorial o como 
un sistema de ecuaciones lineales. Siempre que usted construya un modelo matemático 
de un problema de la vida real, tendrá libertad para elegir qué punto de vista es más natural. 
Además, será posible pasar de una formulación del problema a otra, según sea convenien- 
te. En cualquier caso, la ecuación matricial (4), la ecuación vectorial (5) y el sistema de 
ecuaciones se resuelven de la misma manera: por reducción de filas de la matriz aumen- 
tada (6). Más adelante se analizarán otros métodos de solución. 


Existencia de soluciones 


La definición de Ax conduce directamente al siguiente hecho que resulta útil. 


La ecuación Ax = b tiene una solución si y solo si b es una combinación lineal de las 
columnas de A. 


En la sección 1.3 se consideró la pregunta de existencia: “¿Está b en Gen (aj,..., a,)?”. 
De manera equivalente: “¿Es consistente Ax = b?”. Un problema de existencia más difícil 
consiste en determinar si la ecuación Ax = b es consistente para toda b posible. 


1 3 4 bı 
EJEMPLO 3 Sean A= | —4 2 —6 |y b= | b |. ¿La ecuación Ax = b es con- 
-3 -2 -7 b; 


sistente para todas las posibles b4, b2, b3? 


SOLUCIÓN Se reduce por filas la matriz aumentada para Ax = b: 


1 3 4 bi 1 3 4 bi 
—4 2 —6 b ||~] 0 14 10 ba + 4b: 
—3 —2 -7 b 0 7 5 b} +3bı 
1 3 4 bı 
~i O0 14 10 bz + 4b; 


0 0 0. b3+3bi-L(b,+4b1) 


La tercera entrada en la columna 4 es igual a bı — lb, + b3. La ecuación Ax = b no es 
consistente para toda b porque algunas asignaciones de b pueden hacer que b¡ — tb + b3 
sea diferente de cero. E 





FIGURA 1 Las columnas de 
A = {a], a2, a3} generan un 
plano a través de 0. 


TEOREMA 4 
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La matriz reducida del ejemplo 3 da una descripción de todas las b para las cuales la 
ecuación Ax = b es consistente: las entradas en b deben satisfacer 


bi — bə + b3 = 0 


Esta es la ecuación de un plano que pasa por el origen en R?. El plano es el conjunto de todas 
las combinaciones lineales de las tres columnas de A. Véase la figura 1. 

La ecuación Ax = b del ejemplo 3 no es consistente para todas las b porque la for- 
ma escalonada de A tiene una fila de ceros. Si A tuviera un pivote en las tres filas, no habría 
que preocuparse por los cálculos en la columna aumentada, ya que, en este caso, una forma 
escalonada de la matriz aumentada no tendría una fila como [0 0 0 1. 

En el siguiente teorema, la frase “las columnas de A generan a [R”” significa que cada 
b en RR” es una combinación lineal de las columnas de A. En general, un conjunto de vecto- 
res {V1,..., Vp} en R” genera a R” si cada vector en R” es una combinación lineal de v1,..., Vp; 
es decir, si Gen {v1,..., Vp} = R”. 





Sea A una matriz de m x n. Entonces, los siguientes enunciados son lógicamente equi- 
valentes. Es decir, para una A particular, todos los enunciados son verdaderos o todos 
son falsos. 


a) Para cada b en R”, la ecuación Ax = b tiene una solución. 
b) Cada b en R” es una combinación lineal de las columnas de A. 
c) Las columnas de A generan R”. 


d) A tiene una posición pivote en cada fila. 


El teorema 4 es uno de los teoremas más útiles en este capítulo. Los enunciados a), 
b) y c) son equivalentes a causa de la definición de Ax y lo que significa para un conjunto 
de vectores generar R”. El análisis posterior al ejemplo 3 revela por qué a) y d) son equi- 
valentes; al final de la sección se presenta una prueba de ello. Los ejercicios aportan ejemplos 
de cómo emplear el teorema 4. 


Advertencia: El teorema 4 se refiere a una matriz de coeficientes, no a una matriz aumentada. 
Si una matriz aumentada [A b] tiene una posición pivote en cada fila, entonces la ecuación 
Ax = b puede o no ser consistente. 


Cálculo de Ax 


Los cálculos en el ejemplo 1 se apoyaron en la definición del producto de una matriz A y 
un vector x. El siguiente ejemplo sencillo conducirá a un método más eficiente para calcular 
las entradas en Ax cuando los problemas se resuelvan a mano. 


2 3 4 X1 
EJEMPLO 4 Calcule Ax, donde A=|-1 5 —3|yx=| x>2 
62 8 X3 
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SOLUCIÓN A partir de la definición, 


2 3 4 X1 2 3 4 
—1 5 —3 xi=x|-1|+x 5|+x3] -3 
6-2 8 X3 6 —2 8 
2x1 3x2 4x3 
=| —x1 | + 5x2 | + | —3x3 (7) 
6x1 —2X2 8x3 


2x1 + 3x2 +4x3 
—=x1 + 5x2 — 3x3 
6x1 — 2x2 + 8x3 


La primera entrada en el producto Ax es una suma de productos (algunas veces se llama pro- 
ducto punto), empleando la primera fila de A y las entradas en x. Es decir, 


2 3 4 X1 2x1 + 3x2 + 4x3 
X2 = 
X3 


Esta matriz muestra cómo calcular de forma directa la primera entrada en Ax, sin escribir 
todos los cálculos indicados en (7). De manera similar, la segunda entrada en Ax puede calcu- 
larse multiplicando las entradas en la segunda fila de A por las entradas correspondientes en 
x, y después sumando los productos resultantes: 


—1 5 —3 x2 | = | —x1 + 5x2 — 3x3 


De manera semejante, la tercera entrada en Ax puede determinarse con la tercera fila de A y 
las entradas en x. E 


Regla fila-vector para calcular Ax 


Si el producto Ax está definido, entonces la i-ésima entrada en Ax es la suma de los 
productos de las entradas correspondientes de la fila i de A y del vector x. 


EJEMPLO 5 
e D  [1-4+2-3+(-1):7]_f3 
% jo -5 3 TI [04 +E5-3+3-9] "6 
Peali 2:4 +(=3)-7 18 
bl 8 o0 HE 8-4+0-7|=| 32 
=5 2 (=5)-4+2-7 —6 
1 0 0 r l.r+0-s+0-1£ r 
c) IO 1 0 s|=]|0r+1l:-s+0t]=]ļ|s E 
0 0 1 t O0-r+0-s+1-t t 


Por definición, la matriz del ejemplo 5c) con números 1 en la diagonal y ceros en las 
demás posiciones se llama matriz identidad y se denota con 7. Los cálculos en el inciso c) 
indican que Ix = x para toda x en R?. Existe una análoga matriz identidad de n x n, algu- 
nas veces denotada como 7,,. Al igual que en c), [,X = Xx para toda x en R”. 


TEOREMA 5 
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Propiedades del producto matriz-vector AX 


Es importante el contenido del próximo teorema y se utilizará a lo largo del libro. La demos- 
tración se apoya en la definición de Ax y en las propiedades algebraicas de R”. 


Si A es una matriz de m x n, u y v son vectores en R”, y c es un escalar, entonces: 


a) A(u + v) = Au + Av; 
b) A(cu) = c (Au). 


DEMOSTRACIÓN En aras de la sencillez, se toma n = 3, A = [a] a a], y u, v en R?. 
(La demostración para el caso general es similar). Para i = 1, 2, 3, sean u; y v; las i-ésimas 
entradas en u y v, respectivamente. Para probar el enunciado a), calcule A(u + v) como una 
combinación lineal de las columnas de A empleando como pesos las entradas en u + v. 








ui + v1 
A(u + v) = ¡EN 2 az ] U2 + V2 
U3 + V3 
[ Ñ I Entradas en u + v 
= (u; + vi)aı + (u2 + v2)a2 + (uz + v3)a3 
f f f. Columnas de A 
= (uia; + u2a2 + u3a3) + (via; + v2a2 + V383) 


= Au + Áv 


Para demostrar el enunciado b), calcule A(cu) como una combinación lineal de las columnas 
de A utilizando como pesos las entradas en cu. 


Cui 
A(cu)=[a; az a3]| cuz | = (cuy)a¡ + (cu2)az + (cuz)az 
cCu3 
= c(u1a1) + c(u2a2) + c(u3a3) 
= c(u¡a¡ + uza, + uzaz) 
= c(4u) a 


NOTA NUMÉRICA 


Con la finalidad de optimizar un algoritmo computacional para calcular Ax, la se- 
cuencia de operaciones implicaría datos almacenados en ubicaciones adyacentes de 
memoria. Los algoritmos profesionales más ampliamente utilizados para cálculos ma- 
triciales están escritos en Fortran, un lenguaje que almacena una matriz como un con- 


junto de columnas. Tales algoritmos calculan Ax como una combinación lineal de las 
columnas de A. En contraste, si un programa está escrito en el conocido lenguaje C, 
el cual almacena matrices por filas, entonces Ax debería calcularse mediante la regla 
alternativa que usa las filas de A. 


DEMOSTRACIÓN DEL TEOREMA 4 Como se indicó después del teorema 4, los enuncia- 
dos a), b) y c) son lógicamente equivalentes. De manera que es suficiente demostrar (para 
una matriz arbitraria A) que a) y d) son ambos verdaderos o ambos falsos. Eso vinculará a los 
cuatro enunciados. 

Sea U una forma escalonada de A. Dada b en R”, la matriz aumentada [A b] se puede 
reducir por filas a una matriz aumentada [U d] para alguna d en R”: 


[A b]=*“"*=[U d] 
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Si el enunciado d) es verdadero, entonces cada fila de U contiene una posición pivote y tal 
vez no exista un pivote en la columna aumentada. De manera que Ax = b tiene una solución 
para cualquier b, y a) es verdad. Si d) es falso, la última fila de U solo tiene ceros. Sea d 
cualquier vector con un 1 en su última entrada. En tal caso, [U d] representa un sistema 
inconsistente. Como las operaciones de fila son reversibles, [U d] se puede transformar a la 
forma [A  b]. El nuevo sistema Ax = b también es inconsistente, y a) es falso. E 


PROBLEMAS DE PRÁCTICA 


1 5-2 0 E 7 
1. Sean A=|-3 1 9 —5|,p= y b= 9 |. Es posible demostrar 
0 
4 38 -1 7 cå 0 


que p es una solución de Ax = b. Con base en este hecho, presente a b como una com- 
binación lineal específica de las columnas de A. 


2 5 
3 1 


caso mediante el cálculo de A(u + v) y Au + Av. 


2. Sean Á = | | u= E y v= A Compruebe el teorema 5a) en este 


1.4 EJERCICIOS 


En los ejercicios 1 a 4 calcule los productos utilizando: a) la defini- 9. 5x1+ X2 — 3x3 = 8 10. 4x — x2 = 8 
ción, como en el ejemplo 1, y b) la regla fila-vector para calcular Ax. 2x3 + 4x3 = 0 5x1 + 3x2 =2 
Si un producto está indefinido, explique por qué. 
3x1 — X= 1 
—4 2 3 1 Ds . . 
1 1 6 2 2 3 | :] Considerando A y b en los ejercicios 11 y 12, escriba la matriz au- 
0 1 7 ` 1 -1 mentada para el sistema lineal que corresponde a la ecuación matri- 
cial Ax = b. Después, resuelva el sistema y escriba la solución como 
1 1 un vector: 
Al cil as E LS 1 3 —4 9 
3 3i Sa T 
1 1 11. A= 1. 5 2|,b= 4 
3 1 6 12 
En los ejercicios 5 a 8, aplique la definición de Ax para escribir la 
ecuación matricial como una ecuación vectorial, o viceversa. 1 2 -l l 
12. 4A=|-3 -4 2|,b= 2 
2 1 Za -3 
5 | 1 2 -3 1 | =P | zi 0 3 0-5 
t(-2-3 1-1 0 1 E 
L] | 13. Sean u=|4|y A=|-2 6|. ¿Está u en el plano 
4 1 1 
2 -3 -21 en R? generado por las columnas de A? (Véase la figura). 
3 2 || -3 1 ¿Por qué? 
6 = 
8 —5 5 —49 a 
-2 1 11 a 
4 -5 | 7 ] 6 
—1 3 —8 |__| —8 Plano generado por 
a 7 u —5 + Ys o | 0 .u? las columnas de A 
—4 1 2 =1 


¿Dónde está u? 


2 -1 -4 0 5 
8. al altel stal 3)+2[>]=[13] 4 2 5-1 
-1lya=|o0 1 -1 


14. Sean u = 
En los ejercicios 9 y 10, primero escriba el sistema como una ecua- 4 1 2 0 
ción vectorial y después como una ecuación matricial. conjunto de R? generado por las columnas de A? ¿Por qué? 


. ¿Está u en el sub- 


15. 


16. 


9 3 bz 


ción Ax = b no tiene solución para todas las posibles b, y des- 
criba el conjunto de todas las b para las cuales Ax = b sí tiene 
solución. 


Sean A = E al y b= Pe | Demuestre que la ecua- 


Repita el ejercicio 15 considerando 


Dd bi 
A=|-2 2 0| y b=jb 
E: ba 


Los ejercicios 17 a 20 se refieren a las matrices A y B que se presen- 
tan a continuación. Realice los cálculos pertinentes para justificar sus 
respuestas y mencione un teorema adecuado. 


A= 


17. 


18. 


19. 


20. 


21. 


22. 


1 3 0 3 1 4 TL E 
-1 -1 -1 A lo 1 Ai 

0-4 2 -38 0 2 6 7 

2 0 TEN E 9 S) 


¿Cuántas filas de A contienen una posición pivote? ¿La ecua- 
ción Ax = b tiene solución para cada b en R4? 





¿Cada vector en R4 se puede escribir como una combinación 
lineal de las columnas de la matriz B anterior? ¿Las columnas 
de B generan a R?? 











¿Todo vector en R4 se puede escribir como una combinación 
lineal de las columnas de la matriz A anterior? ¿Las columnas 
de A generan a R4? 


¿Las columnas de B generan a R*? ¿La ecuación Bx = y tiene 
solución para cada y en R4? 


1 0 1 
0 -1 0 
Sea vi= j| ip 25| op E| y pólvo va vs) 
0 1 -1 
genera a R4? ¿Por qué? 
0 0 4 
Sean vı = 0j, w =| —3 |, v = | —2 |. {Vi V2 v3} 
=3 9 —6 


enera a R?? ¿Por qué? 
8 b q 


En los ejercicios 23 y 24, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


23. 


a) La ecuación Ax = b se reconoce como una ecuación vec- 
torial. 


b) Un vector b es una combinación lineal de las columnas 
de una matriz A si y solo si la ecuación Ax = b tiene al me- 
nos una solución. 


c) La ecuación Ax = b es consistente si la matriz aumentada 
[4 b] tiene una posición pivote en cada fila. 


d) La primera entrada en el producto Ax es una suma de pro- 
ductos. 


e) Si las columnas de una matriz A de m x n generan a 
R”, entonces la ecuación Ax = b es consistente para cada 
b en R”. 


Si A es una matriz de m x n y si la ecuación Ax = b es in- 
consistente para alguna b en R”, entonces A no puede tener 
una posición pivote en cada fila. 


$) 


24. 


25. 


26. 


27. 


28. 


29. 


30. 


31. 
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a) Cada ecuación matricial Ax = b corresponde a una ecua- 
ción vectorial con el mismo conjunto solución. 


b) Si la ecuación Ax = b es consistente, entonces b está en el 
conjunto generado por las columnas de A. 


c) Cualquier combinación lineal de vectores siempre se pue- 
de escribir en la forma Ax para una matriz A y un vector x 
adecuados. 


Si la matriz coeficiente A tiene una posición pivote en cada 
fila, entonces la ecuación Ax = b es inconsistente. 


e) El conjunto solución de un sistema lineal cuya matriz au- 
mentada es [a] az a b] coincide con el conjunto so- 
lución de Ax = b, si A = [a] a as. 


f) Si A es una matriz de m x n cuyas columnas no generan 
a R”, entonces la ecuación Ax = b es consistente para toda 
b en R”. 


4 3 1 -3 -7 
Observe que 5 —2 5 —1 | = | —3 |. Con base en 
—6 2 -3 2 10 
este hecho (sin realizar operaciones de fila), encuentre escalares 
-7 4 -3 1 
C1, C2, C3 tales que | —3 |= cı 5 |+c|-2 |+ 5 
10 —6 2 —3 
7 
Sean u = | 2 |, v= | 1 |y w= | 1 |. Es posible demos- 
5 


trar que 2u — 3v — w = 0. Apóyese en este hecho (sin rea- 
lizar operaciones de fila) para obtener xı y x2 que satisfagan la 


7 3 7 5 
ecuación | 2 1 E | =J 1 
5 3 z 1 


Rescriba la siguiente ecuación matricial (numérica) en forma 
simbólica como una ecuación vectorial, utilizando los símbolos 
V1, V2,... para los vectores y Cy, C2,... para los escalares. Defina 
qué representa cada símbolo, utilizando los datos presentados 
en la ecuación matricial. 


=3 2» 4 9 7 
5 8 1-2 —4 


Considere que qı, q2, q3 y V son vectores en R5, mientras que 
X1, X2 y x3 denotan escalares. Escriba la siguiente ecuación vec- 
torial como una ecuación matricial. Identifique cualquier sím- 
bolo que utilice. 


X1Q1 + X2Q2 + x3Q3 = V 


-3 
1 
11 
2 ma 
A -11 


2 


Construya una matriz de 3 x 3, no en forma escalonada, cuyas 
columnas generen a R3. Demuestre que la matriz que construyó 
tiene la propiedad deseada. 


Construya una matriz de 3 x 3, no en forma escalonada, cuyas 
columnas no generen a R3. Demuestre que la matriz que cons- 
truyó tiene la característica deseada. 


Sea A una matriz de 3 x 2. Explique por qué la ecuación Ax = b 
no puede ser consistente para toda b en [R?. Generalice su argu- 
mento al caso de una A arbitraria con más filas que columnas. 
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32. ¿Un conjunto de tres vectores en [R* podría generar a R4? 
Explique su respuesta. ¿Y qué hay respecto de n vectores 
en R” cuando n es menor que m? 


33. Suponga que A es una matriz de 4 x 3, y b es un vector en 
R* con la propiedad de que Ax = b tiene una solución única. 
¿Qué podría decir sobre la forma escalonada reducida de A? 
Justifique su respuesta. 


34. Considere que A es una matriz de 3 x 4, v¡ y v2 son vectores en 
R3, y que w = vi + va. Suponga que v, = Au; y vz = Au» para 
algunos vectores u; y u en R4. ¿Qué hecho permite concluir 
que el sistema Ax = w es consistente? (Nota: u; y uz denotan 
vectores, y no entradas escalares de vectores). 


35. Sean A una matriz de 5 x 3, y un vector en [R3, y z un vector 
en R. Suponga que Ay = z. ¿Qué hecho permite concluir que 
el sistema Ax = 5z es consistente? 


36. Suponga que A es una matriz de 4 x 4 y b un vector en R4 tal 
que Ax = b tiene una solución única. Explique por qué las co- 
lumnas de A deben generar a R4. 


[M] En los ejercicios 37 a 40, determine si las columnas de la matriz 
generan a R4. 


7 2 -5 8 4 -5 -1 8 
-5 -3 4 -9 Y A 
7 ; 
z a ao a a al EEE 
-7 9 2 15 9 1 10 7 
10 -7 1 4 6 
39. | -8 4 -6 -10 -3 
ay Ii so lr g 
3 -1 10 2 da 
5 11 -6 -7 12 
w. | -7 -3 -4 6 -9 


11 5 6 -9 -3 
—3 4 -7 2 7 


41. [M] Encuentre una columna de la matriz del ejercicio 39 que 
se pueda eliminar y, aun así, las restantes columnas de la ma- 
triz sigan generando a R4. 


42. [M] Encuentre una columna de la matriz del ejercicio 40 que 
se pueda eliminar y, aun así, las restantes columnas sigan ge- 
nerando a R4. ¿Se puede eliminar más de una columna? 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. La ecuación matricial 


ao 0 -7 
tose 
Bl: N a 0 


es equivalente a la ecuación vectorial 


zj 0 -7 
-2| ıl+0| 9ļ|-4|-5|=| 9 
-8 a 7 0 


que expresa a b como una combinación lineal de las columnas de A. 


[E 


| 
Au+y)= E aa _ A E E 
eG EERI 
[R 
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1.5 CONJUNTOS SOLUCIÓN DE SISTEMAS LINEALES 


A 


X 


FIGURA 1 


X 


Xx 


Los conjuntos solución de sistemas lineales son importantes objetos de estudio en álgebra 
lineal. Más adelante, se presentarán en diversos contextos. Esta sección utiliza notación vec- 
torial para dar descripciones explícitas y geométricas de tales conjuntos solución. 


Sistemas lineales homogéneos 


Se dice que un sistema de ecuaciones lineales es homogéneo si se puede escribir en la forma 
Ax = 0, donde A es una matriz de m x n, y 0 es el vector cero en RR”. Tal sistema Ax = 0 
siempre tiene al menos una solución, a saber, x = () (el vector cero en R”). Esta solución cero 
generalmente se conoce como solución trivial. Para una ecuación dada Ax = 0, la pregunta 
importante es si existe una solución no trivial, es decir, un vector x diferente de cero que 
satisfaga Ax = 0. El teorema de existencia y unicidad de la sección 1.2 (teorema 2) conduce 
de inmediato al siguiente resultado. 


La ecuación homogénea Ax = 0 tiene una solución no trivial si y solo si la ecuación 
tiene al menos una variable libre. 


EJEMPLO 1 Determine si el siguiente sistema homogéneo tiene una solución no trivial. 
Luego, describa el conjunto solución. 


3x1 + 5x2 — 4x3 = 0 
—3xı — 2x2 + 4x3 = 0 
6x1 + X2 — 8x3 = 0 


SOLUCIÓN Sea A la matriz de coeficientes del sistema; la matriz aumentada [A 0] se re- 
duce por filas a una forma escalonada: 


3 5—4 0 3 5—4 0 3 5—4 0 
232 4 0|-=|0 3 0 0O|-=|0 3 0 0 
6 1—8 0 0—9 0 0 o 0 0 0 


Como x3 es una variable libre, entonces Ax = 0 tiene soluciones no triviales (una para cada 
asignación de x3). Para describir el conjunto solución, continúe la reducción por filas de 
[A 0] hasta su forma escalonada reducida: 


et xı —-3%3=0 
0.1 00 xa =0 
0.0.0.0 dá 


Al despejar las variables básicas xı y x2 se obtiene xı = 3X3, x2 = 0, con x; libre. Como un 
vector, la solución general de Ax = 0 tiene la forma 


4 4 4 
Y 3% 3 3 
X=|x |= 0 =xX3| 0 | =x3v, dondev=| 0 
X3 X3 1 1 


Aquí se factorizó x3 de la expresión para la solución general vectorial. Esto muestra que cada 
solución de Ax = 0 es, en este caso, un múltiplo escalar de v. La solución se obtiene al consi- 
derar x3 = 0. Geométricamente, el conjunto solución es una recta que pasa por 0 en R3. Véase 
la figura 1. E 
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FIGURA 2 


Observe que una solución no trivial x puede tener algunas entradas cero, siempre y cuan- 
do no todas ellas sean cero. 


EJEMPLO 2 Una sola ecuación lineal puede tratarse como un sencillo sistema de ecua- 
ciones. Describa todas las soluciones del “sistema” homogéneo 


10x1 = 3x2 = 2x3 =0 d) 


SOLUCIÓN No hay necesidad de una notación matricial. Despeje la variable básica xı en 
términos de las variables libres. La solución general es xı = .3x2 + .2x3, con x2 y x3 libres. 
Como un vector, la solución general es 


X1 3x2 + .2X3 .3X2 2X3 
X=| Xx |= X2 = x2 | + 0 
X3 X3 0 X3 
3 2 
=xXx| 1|+x3| 0 (con x2, x3 libres) (2) 
0 1 
t 1 
u v 


Este cálculo indica que cada solución de (1) es una combinación lineal de los vectores u 
y v, que se muestran en (2). Es decir, el conjunto solución es Gen {u, v}. Puesto que u y v 
no son múltiplos entre sí, el conjunto solución es un plano que pasa por el origen. Véase 
la figura 2. E 


Los ejemplos 1 y 2, junto con los ejercicios, ilustran el hecho de que el conjunto so- 
lución de una ecuación homogénea Ax = 0 siempre se puede expresar de manera explícita 
como Gen {V1,..., Vp} para vectores adecuados V1,..., Vp. Si la única solución es el vector 
cero, entonces el conjunto solución es Gen {0}. Si la ecuación Ax = 0 solo tiene una variable 
libre, el conjunto solución es una recta que pasa por el origen, como en la figura 1. Un plano 
que pasa por el origen, como en la figura 2, da una buena imagen mental para el conjunto 
solución de Ax = 0 cuando existen dos o más variables libres. Observe, sin embargo, que 
se puede emplear una figura similar para visualizar Gen {u, v} aun cuando u y v no estén 
relacionados con soluciones de Ax = 0. Véase la figura 11 de la sección 1.3. 


Forma vectorial paramétrica 


La ecuación original (1) para el plano del ejemplo 2 es una descripción implícita del plano. 
Al resolver esta ecuación se obtiene una descripción explícita del plano como el conjunto 
generado por u y v. La ecuación (2) se llama ecuación vectorial paramétrica del plano. 
Algunas veces dicha ecuación se escribe como 


x=su+tv (s,tenR) 


para poner de relieve que los parámetros varían sobre todos los números reales. En el ejemplo 
1, la ecuación x = x3v (con x3 libre), o x = tv (con ż en R), es la ecuación vectorial paramé- 
trica de una recta. Siempre que un conjunto solución se describa explícitamente con vectores 
como en los ejemplos 1 y 2, se dirá que la solución está en forma vectorial paramétrica. 


Soluciones de sistemas no homogéneos 


Cuando un sistema lineal no homogéneo tiene muchas soluciones, la solución general se 
puede escribir en forma vectorial paramétrica como un vector más una combinación lineal 
arbitraria de vectores que satisfagan el sistema homogéneo correspondiente. 





FIGURA 3 
La suma de p a v traslada 
vav +p. 





FIGURA 4 
Recta trasladada. 
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EJEMPLO 3 Describa todas las soluciones de Ax = b, donde 


3.54 7 
A=|=3=2 4 | y bh=|-=1 
6 1—8 —4 


SOLUCIÓN Aquí A es la matriz de coeficientes del ejemplo 1. Al efectuar operaciones de fila 
sobre [A b] se obtiene 


3 5—4 7 1 0 -4 -1 x  —ím=-1 
—3 —2 4-—-1Ij~]|O 1 0 ; X2 = 2 
6 1 —8 —4 (0) 0 0 0 = 0 
Por lo tanto, xı = —1 + 2x3, X2 = 2, x2 = 2 y x3 es libre. Como un vector, la solución ge- 
neral de Ax = b tiene la forma 
X1 —1 + 3x3 —1 3x3 —1 $ 
x=l|x |= 2 = 2 |+ 0 = 2|+x310 
X3 x3 0 X3 0 1 
t t 
p v 


La ecuación x = p + x3v, o, escribiendo £ como un parámetro general, 
x=p+:v (ten R) (3) 


describe el conjunto solución de Ax = b en forma vectorial paramétrica. Recuerde del ejem- 
plo 1 que el conjunto solución de Ax = 0 tiene la ecuación vectorial paramétrica 


x=tv (tea R) (4) 


[con la misma v que aparece en (3)]. Así, las soluciones de Ax = b se obtienen sumando el 
vector p a las soluciones de Ax = 0. El propio vector p es justamente una solución particular 
de Ax = b [correspondiente a t = 0 en (3)]. E 


Para describir el conjunto solución de Ax = b en forma geométrica, podemos pensar que 
la suma vectorial es una traslación. Dados v y p en R? o R$, el efecto de sumar p a v es mover 
a v en una dirección paralela a la recta que pasa por p y 0. Se dice que p traslada a v hacia v 
+ p. Véase la figura 3. Si cada punto sobre la recta L en R? o R? es trasladado por un vector 
p, el resultado es una recta paralela a L. Véase la figura 4. 

Suponga que L es la recta que pasa por 0 y v, descrita mediante la ecuación (4). Sumar 
p a cada punto sobre L produce la recta trasladada que describe la ecuación (3). Observe 
que p está sobre la recta en la ecuación (3). Así, (3) es la ecuación de la recta que pasa 
por p paralela a v. Entonces el conjunto solución de Ax = b es una recta que pasa por p 
paralela al conjunto solución de Ax = 0. La figura 5 ilustra este caso. 








FIGURA 5 Conjuntos solución paralelos de 
Ax =byAx=0. 


La relación entre los conjuntos solución de Ax = b y Ax = 0, que se ilustra en la figura 
5, se generaliza a cualquier ecuación consistente Ax = b, aunque el conjunto solución será 
más grande que una recta cuando existan muchas variables libres. El siguiente teorema da el 
enunciado preciso. Para una demostración, véase el ejercicio 25. 
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TEOREMA 6 


Suponga que la ecuación Ax = b es consistente para alguna b dada, y sea p una solu- 
ción. El conjunto solución de Ax = b es el conjunto de todos los vectores de la forma 
W =p + v;, donde v, es cualquier solución de la ecuación homogénea Ax = 0. 


El teorema 6 dice que si Ax = b tiene una solución, entonces el conjunto solución se 
obtiene al trasladar el conjunto solución de Ax = 0, empleando cualquier solución particular 
p de Ax = b para dicha traslación. La figura 6 ilustra el caso en que existen dos variables 
libres. Aun cuando n > 3, nuestra imagen mental del conjunto solución de un sistema con- 
sistente AX = b (con b + 0) es un solo punto diferente de cero, o una recta o un plano que no 
pasan por el origen. 


Ax=b 


Ax=0 





FIGURA 6 Conjuntos solución 
paralelos de Ax = b y Ax = 0. 


Advertencia: El teorema 6 y la figura 6 solamente se aplican a una ecuación Ax = b que tiene 
al menos una solución p diferente de cero. Cuando Ax = b no tiene solución, entonces el 
conjunto solución es vacío. 


El siguiente algoritmo resume los cálculos que se muestran en los ejemplos 1, 2 y 3. 


ESCRITURA DE UN CONJUNTO SOLUCIÓN (DE UN SISTEMA CONSISTENTE) 
EN FORMA VECTORIAL PARAMÉTRICA 
1. Reduzca por filas la matriz aumentada a su forma escalonada reducida. 


2. Exprese cada variable básica en términos de cualquiera de las variables libres pre- 
sentes en una ecuación. 


3. Escriba una solución típica x como un vector cuyas entradas dependen de las varia- 
bles libres (si las hay). 


4. Descomponga x en una combinación lineal de vectores (con entradas numéricas) 
empleando las variables libres como parámetros. 


PROBLEMAS DE PRÁCTICA 
1. Cada una de las siguientes ecuaciones determina un plano en R3. ¿Se intersecan los dos 
planos? Si es así, describa su intersección 
xi + 4x2 — 5x3 = 0 
2x1 — X2 + 8x3 = 9 


2. Escriba la solución general de 10x, — 3x2 — 2x3 = 7 en forma vectorial paramétrica, y 
relacione el conjunto solución con el obtenido en el ejemplo 2. 


1.5 EJERCICIOS 


En los ejercicios 1 a 4, determine si el sistema tiene una solución no 
trivial. Intente usar lo menos posible las operaciones de fila. 
1. 2x1 = 5x2 + 8x3 =0 2. 
—2x1 ei 1x2 + x= 0 
4x1 + 2x2 + 1x3 =0 


xı — 2x2 + 3x3 = 0 
—2xı = 3x2 —= 4x3 =0 
2x1 — 4x2 + 9x3 =0 


3. -—3x1+4x, —-8x3=0 4. 
—2x1 + 5x2 + 4x3 =0 


5x1 > 3x2 + 2x3 =0 
3x1 a 4x2 + 2x3 =0 
En los ejercicios 5 y 6, siga el método de los ejemplos 1 y 2 para es- 


cribir el conjunto solución del sistema homogéneo en forma vectorial 
paramétrica. 


5. 2x1 + 2x2 + 4x3 =0 6. x + 2x2 == 3x3 =0 
—4x1 = 4x2 = 8x3 =0 2x1 + xn- 3x3 =0 
— 3x2 — 3x3 = 0 —=1x¡ + X2 =0 


En los ejercicios 7 a 12, describa todas las soluciones de Ax = 0 
en forma vectorial paramétrica, donde A es equivalente por filas a 


la matriz dada. 
7. 1 3 —3 7 8. 1 -3 -8 5 
0 1-4 5 0 1 2 -4 


9. 3-6 6 10. -1-4 0-4 
2 4 -—2 2-8 0 8 
1 —4 -2 0 3 -5 
0.0 1 0 0 -i 
11 0o 0 0 0 1 —4 
o 0 0 0 0 0 
1-2 3-6 5 0 
12. |0 0 0 1 4-6 
0.0 0 0 0. 1 
0 0. 0 0 0.0 
13. Suponga que el conjunto solución de un cierto sistema de ecua- 
ciones lineales se describe como x¡ = 5 + 4x3, x2 = -2 — 7x3, 
con x3 libre. Use vectores para describir este conjunto como una 
recta en R. 


14. Suponga que el conjunto solución de un cierto sistema de 
ecuaciones lineales se describe como xı = 5x4, X2 = 3 — 2x4, 
x3 = 2 + 5x4, con x4 libre. Utilice vectores para describir este 
conjunto como una “recta” en R4. 


15. Describa y compare los conjuntos solución de xı + 5x2 — 3x3 = 0 
y x1 + 5x2 — 3x3 = —2. 


16. Describa y compare los conjuntos solución de xı — 2x2 + 3x3 = 0 
y X1 — 2x2 + 3x3 =4, 


17. Siga el método del ejemplo 3 para describir las soluciones del 
siguiente sistema en forma vectorial paramétrica. También, dé 
una descripción geométrica del conjunto solución y compárelo 
con el que obtuvo en el ejercicio 5. 


2x1 + 2x2 + 4x3 = 8 
—4x¡ => 4x2 aa 8x3 = -16 
= 3x2 > 3x3 = 12 
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18. Como en el ejercicio 17, describa las soluciones del siguiente 
sistema en forma vectorial paramétrica, y realice una compara- 
ción geométrica con el conjunto solución del ejercicio 6. 


xı + 2x2 — 3x3 = 5 
2x1 + X2 — 3X3 = 13 


—X1 + X2 = —$8 


En los ejercicios 19 y 20, encuentre la ecuación paramétrica de la 
recta que pasa por a y es paralela a b. 


el [|] 


En los ejercicios 21 y 22, obtenga una ecuación paramétrica de la 
recta M que pasa a través de p y q. [Sugerencia: M es paralela al 
vector q — p. Véase la figura que aparece más abajo]. 


2 [3] 2-2] 


X2 





En los ejercicios 23 y 24, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


23. a) Una ecuación homogénea siempre es consistente. 


b) La ecuación Ax = 0 da una descripción explícita de su con- 
junto solución. 


c) La ecuación homogénea Ax = 0 tiene la solución trivial si 
y solo si la ecuación tiene al menos una variable libre. 


d) La ecuación x = p + tv describe una recta que pasa por v 
y es paralela a p. 


e) El conjunto solución de Ax = b es el conjunto de todos los 
vectores de la forma w = p + vz, donde v, es cualquier so- 
lución de la ecuación Ax = 0. 


24. a) Un sistema homogéneo de ecuaciones puede ser inconsis- 
tente. 


b) Si x es una solución no trivial de Ax = 0, entonces cada 
entrada en x es distinta de cero. 


c) El efecto de sumar p a un vector es mover a dicho vector 
en una dirección paralela a p. 


d) La ecuación Ax = b es homogénea si el vector cero es una 
solución. 
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25. 


26. 


27. 


e) Si Ax = b es consistente, entonces el conjunto solución 
de Ax = b se obtiene por traslación del conjunto solución de 
Ax =Q. 


Demuestre el teorema 6: 


a) Suponga que p es una solución de Ax = b, de manera que 
Ap = b. Sea v, cualquier solución de la ecuación homo- 
génea Ax = 0, y sea w = p + v,. Demuestre que w es una 
solución de Ax = b. 


b) Sea w cualquier solución de Ax = b, y defina v, = w — p. 
Demuestre que v, es una solución de Ax = 0. Esto demues- 
tra que cada solución de Ax = b tiene la forma w = p + Vp, 
donde p es una solución particular de Ax = b y v, una 
solución de Ax = 0. 


Suponga que A es la matriz cero de 3 x 3 (con cero en todas 
las entradas). Describa el conjunto solución de la ecuación 
Ax =0. 


Suponga que Ax = b tiene una solución. Explique por qué la 
solución es única precisamente cuando Ax = 0 tiene solo la so- 
lución trivial. 


En los ejercicios 28 a 31, a) ¿la ecuación Ax = 0 tiene una solución 
no trivial? b) ¿La ecuación Ax = b tiene al menos una solución para 
toda posible b? 


28. 
29. 
30. 
31. 
32. 


33. 


A es una matriz de 3 x 3 con tres posiciones pivote. 
A es una matriz de 4 x 4 con tres posiciones pivote. 
A es una matriz de 2 x 5 con dos posiciones pivote. 
A es una matriz de 3 x 2 con dos posiciones pivote. 


Sib + 0, ¿el conjunto solución de Ax = b puede ser un plano 
que pasa por el origen? Explique su respuesta. 


Construya una matriz A, diferente de cero, de 3 x 3 tal que el 


1 
vector | 1 
1 


sea una solución de Ax = 0. 


34. 


35. 


36. 


37. 


38. 


39. 


40. 


Construya una matriz A, diferente de cero, de 3 x 3 tal que el 


2 
vector | —1 | sea una solución de Ax = 0. 
1 
-1 -3 
A partir de A = 7 21 |, encuentre por inspección una 
—2 —6 


solución no trivial de Ax = 0. [Sugerencia: Piense en la ecua- 
ción Ax = 0 escrita como una ecuación vectorial]. 


3 -2 
A partir de A = | —6 4 |, encuentre por inspección una 
12 —8 
solución no trivial de Ax = 0. 


Construya una matriz A de 2 x 2 tal que el conjunto solución 
de la ecuación Ax = 0 sea la recta en R? que pasa a través de 
(4, 1) y el origen. Luego, encuentre un vector b en R? tal que 
el conjunto solución de Ax = b no sea una recta en R? paralela 
al conjunto solución de Ax = 0. ¿Por qué esto no contradice al 
teorema 6? 


Sean A una matriz de m x n, y w un vector en R” que satisface 
la ecuación Ax = 0. Demuestre que para cualquier escalar c, 
el vector cw también satisface Ax = 0. [Es decir, demuestre 
que A(cw) = 0]. 


Suponga que A es una matriz de m x n, y que v y w son 
vectores en R” tales que Av = 0 y Aw = 0. Explique por 
qué A(v + w) debe ser el vector cero. Luego, explique 
por qué A(cv + dw) = 0 para cada par de escalares c y d. 


Suponga que A es una matriz de 3 x 3 y b es un vector en R? 
tales que la ecuación Ax = b no tiene solución. ¿Existe un 
vector y en R? tal que la ecuación Ax = y tiene una solución 
única? Justifique su respuesta. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Reduzca por filas la matriz aumentada: 


1 4 —5 1 4 —5 0 1 0 3 4 
2-1 8 0-9 18 9 0 1 -2 -1 
X1 + 3x3 = 4 
ADE 2x3 =-1 
Por lo tanto, xı = 4 — 3x3, x2 = —1 + 2x3, con x3 libre. La solución general en forma 
vectorial paramétrica es 
X1 4— 3x3 4 —3 
x: | = | -1 +2x | =| -1 |+ x3 2, 
X3 X3 0 1 


1 


v 


T — 


La intersección de los dos planos es la recta que pasa por p en la dirección de v. 
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2. La matriz aumentada [10 —3 -—2 7] es equivalente por filas a [1 —.3 —.2 .7], 
y la solución general es x¡ = .7 + .3x2 + .2x3, con x> y x3 libres. Es decir, 


X1 .7 + .3x2 + .2x3 7 3 2 
x=|x |= X2 =| 0|+x| 1|+x3]| 0 
X3 X3 0 0 1 

= p + x20 + X3V 


El conjunto solución de la ecuación no homogénea Ax = b es el plano trasladado 
p + Gen {u, v}, que pasa por p y es paralelo al conjunto solución de la ecuación homo- 
génea del ejemplo 2. 


1.6 | APLICACIONES DE SISTEMAS LINEALES 


Tal vez usted espere que un problema de la vida real que implica álgebra lineal tenga solo una 
solución, o quizá ninguna solución. La finalidad de esta sección es mostrar cómo, de manera 
natural, surgen sistemas lineales con muchas soluciones. Aquí las aplicaciones provienen de 
áreas como economía, química y flujo en redes. 


Un sistema homogéneo en economía 


El sistema de 500 ecuaciones con 500 variables, que se mencionó en la introducción de este 
capítulo, ahora se conoce como un modelo de “entrada-salida” (o “producción”) de Leontief.! 
En la sección 2.6 se examinará este modelo con más detalle, cuando se disponga de más bases 
teóricas y de una mejor notación. Por ahora, se considerará un “modelo de intercambio” más 
sencillo, que también se debe a Leontief. 

Suponga que la economía de una nación se divide en muchos sectores, como manufactu- 
ra, comunicaciones, entretenimiento y servicios. Considere que se conoce la producción total 
anual de cada sector y se sabe exactamente cómo esta producción se divide o se “intercambia” 
entre los otros sectores de la economía. Al valor total en dólares de la producción de un sector 
se le llama precio de esa producción. Leontief probó el siguiente resultado. 


Existen precios de equilibrio que se pueden asignar a las producciones totales de 
varios sectores, de tal forma que el ingreso de cada sector equilibra exactamente 
sus gastos. 


El siguiente ejemplo ilustra cómo encontrar los precios de equilibrio. 


EJEMPLO 1 Suponga que una economía comprende las industrias carbonífera, eléctrica 
y del acero, y que la producción de cada sector se distribuye entre los diversos sectores como 
se muestra en la tabla 1, página 50: las entradas en una columna representan las partes frac- 
cionales de la producción total de un sector industrial. 

La segunda columna de la tabla 1, por ejemplo, dice que la producción total del sector 
eléctrico se divide como sigue: 40% a la industria del carbón, 50% a la del acero, y el restante 
10% a la industria eléctrica. (El sector eléctrico trata a este 10% como un gasto en el que se 
incurre con la finalidad de operar su negocio). Como se deben considerar todas las produc- 
ciones, las fracciones decimales en cada columna deben sumar 1. 


1 Véase Wassily W. Leontief, “Input-Output Economics”, Scientific American, octubre de 1951, pp. 15-21. 
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Energía eléctrica 





Denote los precios (es decir, valores en dólares) del total de las producciones anuales 
de los sectores del carbón, eléctrico y del acero mediante pc, Pg y ps, respectivamente. Si es 
posible, encuentre los precios de equilibrio que hacen que los ingresos de cada sector igualen 
a sus gastos. 


TABLA 1 Una economía básica 








$ Distribución de la producción por sectores: 
Del carbón Eléctrico Del acero Comprada por: 
.0 4 .6 S. del carbón 
6 .1 2 S. eléctrico 
6 4 5 2 S. del acero 





SOLUCIÓN En cada columna se indica hacia dónde va la producción de cada sector indus- 
trial; si deseamos saber qué necesita cada sector como insumos, hay que leer a lo largo de 
cada fila. Por ejemplo, la primera fila de la tabla 1 dice que el sector del carbón recibe (y paga) 
el 40% de la producción del sector eléctrico y el 60% del producto de la industria del acero. 
Puesto que los respectivos valores de las producciones totales son pg y ps, la industria del carbón 
debe gastar .4pg dólares por compartir el producto del sector eléctrico y .6pg por la produc- 
ción de la industria del acero. Así, los gastos totales del sector carbonífero son .4pg + .6ps. 
Para hacer que el ingreso de la industria del carbón, pc, sea igual a sus gastos, escribimos 


Pc = Apg + .6ps (1) 


La segunda fila de la tabla de intercambio indica que el sector eléctrico gasta 0.6pc en 
la industria del carbón, 0.1pg en energía eléctrica, y 0.2ps en la industria del acero. Así que 
el requerimiento de ingreso/gasto para el sector eléctrico es 


pe = .6pc + .1pg + .2ps (2) 
Finalmente, la tercera fila de la tabla de intercambio conduce al último requerimiento: 
Ps = Apc + .Spg + .2ps (3) 


Para resolver el sistema de ecuaciones (1), (2) y (3), se transfieren todas las incógnitas a los 
lados izquierdos de las ecuaciones y se combinan términos semejantes. [Por ejemplo, en 
el lado izquierdo de (2), se escribe pg — .1pg como .9pp.] 


Pc — 4pg — .6ps =0 
—.6pc + -9pg — .2ps=0 
—.4pc = -SPg + -8Ps =0 


El siguiente paso es reducir por filas. Aquí, para simplificar, los decimales se redondean 
a dos cifras. 


1-46 0 1-4 =6 0 1 —-4 —6 0 
=6 9-2 0|-=]|0 a 0|=]J|0 a 0 
=4=5 8 0 0 —.66 0 0 0 
1-4 =6 0 1 0 —.94 
~| o0 a 0 0 E 
0 0 0 
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La solución general es pc = .94ps, pg = .85ps, y ps es libre. El vector de precios de equili- 
brio para la economía tiene la forma 


Pc .94 ps .94 
P=| PE | =| -85ps | = ps | .85 
Ps Ps 1 


Cualquier asignación (no negativa) para ps da por resultado una asignación de precios de 
equilibrio. Por ejemplo, si se toma ps como 100 (o $100 millones), entonces pc = 94 y 
pe = 85. Los ingresos y gastos de cada sector serán iguales si la producción de carbón 
se cotiza en $94 millones, la de energía eléctrica en $85 millones, y la de acero en $100 
millones. E 


Balanceo de ecuaciones químicas 


Las ecuaciones químicas describen las cantidades de sustancias que se consumen y producen 
en reacciones químicas. Por ejemplo, cuando el gas propano se quema, el propano (C3Hg) se 
combina con oxígeno (O) para formar dióxido de carbono (CO») y agua (H20), de acuerdo 
con una ecuación de la forma 


(x1)C3Hg + (x2)02 —> (x3)CO2 + (x4)H20 (4) 


Para “balancear” esta ecuación, un químico debe encontrar números x;,..., x4 tales que los 
números totales de átomos de carbón (C), hidrógeno(H) y oxígeno (O) en el lado izquierdo 
concuerden con los números de átomos correspondientes en el lado derecho (porque, en la 
reacción, los átomos no se crean ni se destruyen). 

Un método sistemático para balancear ecuaciones químicas es colocar una ecuación vec- 
torial que describa el número de átomos de cada tipo presentes en una reacción. Como la 
ecuación (4) implica a tres tipos de átomos (carbón, hidrógeno y oxígeno), construya un 
vector en R? para cada reactante y producto en (4) que liste los números de “átomos por mo- 
lécula”, como sigue: 


3 0 1 0 | <—Carbón 
C3Hg: | 8 |, O>: | 0 |, CO>: | O |, HO: | 2 | «— Hidrógeno 
0 2 2 1 | -— Oxígeno 


Para balancear la ecuación (4), los coeficientes x;,..., x4 deben satisfacer 


3 0 1 0 
X1 8 + x2 0 = X3 0 + X4 2 
0 2 2 1 


Para resolver, mueva todos los términos a la izquierda (cambiando los signos en los vectores 
tercero y cuarto): 


3 0 -1 0 0 
Xx|8SI|+x]|0]|+2>x 0l|+x14p-2|=]|0 
0 2 —2 —1 0 


La reducción por filas de la matriz aumentada para esta ecuación conduce a la solución 
general 


X = 1x4, X2 = 7x4, X3 = 3x4, con xx libre 


Como los coeficientes en una ecuación química deben ser enteros, tome x, = 4; en tal caso, 
x1 =1,x,=3yx3 = 3. La ecuación balanceada es 
C3Hg + 50, > 3C0, E 4H,0 


La ecuación también estaría balanceada si, por ejemplo, cada coeficiente se duplicara. Sin 
embargo, para la mayoría de los propósitos, los químicos prefieren utilizar una ecuación ba- 
lanceada cuyos coeficientes sean los números más pequeños posibles. 
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Xi 
30 
X2 


FIGURA 1 
Una unión, también llamada nodo. 


Flujo de redes 


Los sistemas de ecuaciones lineales se originan naturalmente cuando científicos, ingenie- 
ros o economistas estudian el flujo de alguna cantidad a través de una red. Por ejemplo, 
los planificadores urbanos y los ingenieros de tráfico monitorizan el patrón de flujo de 
tránsito en una rejilla de las calles de la ciudad. Los ingenieros eléctricos calculan el flujo 
de corriente a través de circuitos eléctricos. Y los economistas analizan la distribución de 
productos del fabricante al consumidor a través de una red de mayoristas y minoristas. Para 
muchas redes, los sistemas de ecuaciones implican cientos o incluso miles de variables y 
ecuaciones. 

Una red consiste en un conjunto de puntos llamados uniones, o nodos, con líneas o arcos 
llamados ramas, que conectan algunos o todos los nodos. Se indica la dirección y el sentido 
de flujo en cada rama, y la cantidad de flujo (o tasa) se denota con una variable. 

La suposición básica en el flujo de red es que el flujo total en la red es igual al flujo 
total de salida de la red, y que el flujo total en un nodo es igual al flujo total de salida en 
dicho nodo. Por ejemplo, la figura 1 muestra 30 unidades que fluyen por una rama hacia 
una unión; xı y x2 denotan los flujos de salida del nodo a través de otras ramas. Como el 
flujo se “conserva” en cada unión, entonces xı + x2 = 30. En forma similar, el flujo en cada 
nodo se describe mediante una ecuación lineal. El problema de análisis de redes es deter- 
minar el flujo en cada rama cuando se tiene información parcial (como el flujo de entrada 
y salida de la red). 


EJEMPLO 2 Lared de la figura 2 representa el flujo del tránsito (en vehículos por hora) 
en varias calles de un solo sentido en el centro de Baltimore en un día común, poco después 
del mediodía. Determine el patrón de flujo general para la red. 


Calvert St. South St. 


Lombard St. 


Xx 


Pratt St. 





FIGURA 2 Calles de Baltimore. 


SOLUCIÓN Escriba las ecuaciones que describen el flujo, y después encuentre la solución 
general del sistema. Marque las intersecciones de las calles (nodos) y los flujos desconocidos 
en las ramas, como se indica en la figura 2. En cada intersección, iguale el flujo de entrada 
al de salida. 


Intersección Flujo de entrada Flujo de salida 

















A 300 + 500 = xı + x2 
B x2 + x4 = 300 + x3 
C 100 + 400 = x4 + x5 
D xı + x5 = 600 
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También, el flujo total de entrada en la red (500 + 300 + 100 + 400) es igual al flujo total 
de salida (300 + x3 + 600), que se simplifica a xz3 = 400. Combine esta ecuación con un 
reordenamiento de las primeras cuatro ecuaciones para obtener el siguiente sistema de 
ecuaciones: 


xı + X2 = 800 
X2 — X3 + X4 = 300 

x4 + x5 = 500 

X1 + x5 = 600 
X3 = 400 


La reducción por filas de la matriz aumentada conduce a 


X1 + xs = 600 
X2 — x5 = 200 

X3 = 400 

x4 + x5 = 500 


El patrón de flujo general para la red está descrito por 


xı = 600 — x5 
x2 = 200 + x5 
x3 = 400 
x4 = 500 — x5 
x5 es libre 


Un flujo negativo en una rama de la red corresponde a un flujo en el sentido opuesto 
al indicado en el modelo. Como las calles en este problema son de un solo sentido, ninguna 
de las variables puede ser negativa. Este hecho conduce a ciertas limitaciones sobre los po- 
sibles valores de las variables. Por ejemplo, xs = 500 porque x4 no puede ser negativa. En el 
problema de práctica 2 se consideran otras restricciones sobre las variables. E 


PROBLEMAS DE PRÁCTICA 


1. Suponga que una economía tiene tres sectores: agricultura, minería y manufactura. Agri- 
cultura vende el 5% de su producción a minería y el 30% a manufactura, y retiene el resto. 
Minería vende el 20% de su producto a agricultura y el 70% a manufactura, conservando 
el resto. Manufactura vende el 20% de su producción a agricultura y el 30% a minería, 
y retiene lo restante. Determine la tabla de intercambio para esta economía; utilice las 
columnas para describir cómo la producción de cada sector se intercambia entre los tres 
sectores. 


2. Considere el flujo de red que se analizó en el ejemplo 2. Determine el posible rango de 
valores de xı y x2. [Sugerencia: El ejemplo mencionó que xs = 500. ¿Qué implicaciones 
tiene esto sobre xı y x2? Además, considere el hecho de que x5 = 0]. 
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6 EJERCICIOS 


Suponga que una economía solo tiene dos sectores: bienes y 
servicios. Cada año, el sector de bienes vende el 80% de su pro- 
ducción al de servicios y retiene el resto, mientras que el sector 
de servicios vende el 70% de su producción al sector de bienes 
y conserva lo restante. Encuentre los precios de equilibrio para 
las producciones anuales de los sectores de bienes y servicios 
que permiten igualar el ingreso con el gasto de cada sector. 


Bienes Servicios 





Encuentre otro conjunto de precios de equilibrio para la econo- 
mía del ejemplo 1. Suponga la misma economía, pero que ahora 
se utiliza el yen japonés en vez del dólar estadounidense para 
medir los valores de las diversas producciones de los sectores. 
¿Esto modificaría el problema en algún sentido? Analícelo. 


Considere una economía con tres sectores: combustibles y ener- 
gía, manufactura y servicios. Combustibles y energía vende el 
80% de su producción a manufactura, el 10% a servicios, y re- 
tiene el resto. Manufactura vende el 10% de su producción a 
combustibles y energía, el 80% a servicios, y conserva lo res- 
tante. Servicios vende el 20% a combustible y energía, el 40% 
a manufactura, y retiene el resto. 


a) Construya la tabla de intercambio para esta economía. 


b) Desarrolle un sistema de ecuaciones que permita determi- 
nar los precios con los cuales se igualen los ingresos y gas- 
tos de cada sector. Después, escriba la matriz aumentada 
que puede reducirse por filas para obtener esos precios. 


c) [M] Encuentre un conjunto de precios de equilibrio cuando el 
precio para la producción de servicios es de 100 unidades. 


Suponga que una economía tiene cuatro sectores: minero, ma- 
derero, de energía y del transporte. Minería vende el 10% de 
su producción al sector maderero, el 60% a energía, y conserva 
el resto. El sector maderero vende el 15% de su producción a 
minería, el 50% a energía, el 20% al sector del transporte, y 
conserva lo restante. Energía vende el 20% de su producción a 
minería, el 15% al sector maderero, el 20% al sector del trans- 
porte, y retiene el resto. El sector del transporte vende el 20% de 
su salida de producción a minería, el 10% al sector maderero, el 
50% a energía, y conserva lo restante. 


a) Construya la tabla de intercambio para esta economía. 


b) [M] Encuentre un conjunto de precios de equilibrio para esta 
economía. 


Una economía tiene cuatro sectores: agricultura, manufactura, 
servicios y transporte. El sector agrícola vende el 20% de su 
producción a manufactura, el 30% a servicios, el 30% al sector 
del transporte, y conserva el resto. Manufactura vende el 35% 
de su producción al sector agrícola, el 35% a servicios, el 20% 


al sector del transporte, y conserva el resto. Servicios vende el 
10% de su salida de producción a agricultura, el 20% a manu- 
factura, el 20% al sector del transporte, y conserva el resto. El 
sector del transporte vende el 20% de su salida de producción a 
agricultura, el 30% a manufactura, el 20% a servicios, y conser- 
va el remanente. 


a) Construya la tabla de intercambio para esta economía. 


b) [M] Encuentre un conjunto de precios de equilibrio para la 
economía si el valor del producto del sector del transporte 
es de $10.00 por unidad. 


c) El sector de servicios lanza una exitosa campaña para “comer 
productos frescos de granja”, e incrementa su participación 
con el sector agrícola al 40%, mientras que su participa- 
ción con el sector manufacturero cae al 10%. Construya la 
tabla de intercambio para esta nueva economía. 


d) [M] Encuentre un conjunto de precios de equilibrio para esta 
nueva economía si el valor del sector del transporte continúa 
a $10.00 por unidad. ¿Qué efectos tuvo la campaña de “co- 
mer productos frescos de granja” sobre los precios de equili- 
brio para los sectores en esta economía? 


En los ejercicios 6 a 11, balancee las ecuaciones químicas utilizando 
el enfoque de ecuación vectorial analizado en esta sección. 


6. 


10. 


11. 


El óxido de aluminio y el carbón reaccionan para crear el ele- 
mento aluminio y dióxido de carbono: 


ALO +C>Al+ CO, 


[Para cada compuesto, construya un vector que liste los núme- 
ros de átomos de aluminio, oxígeno y carbón]. 


El Alka-Seltzer contiene bicarbonato de sodio (NaHCOs) y áci- 
do cítrico (H3C¿H507). Cuando se disuelve una tableta en agua, 
la siguiente reacción produce citrato de sodio, agua y dióxido de 
carbono (gas): 


NaHCO; T H3C6H507 => Na3C¿H50; T HO T CO, 


La piedra caliza, CaCO3, neutraliza el ácido, H30, en la lluvia 
ácida, mediante la siguiente ecuación sin balancear: 


H3O + CaCO; —> H20 + Ca + CO, 


El sulfhídrico de boro reacciona violentamente con agua para 
formar ácido bórico y gas sulfhídrico de hidrógeno (que expide 
olor a huevo podrido). La ecuación sin balancear es 


B253 + HO > H3BO; an H2S 


[M] Si es posible, utilice aritmética exacta o un formato racional 
para los cálculos al balancear la siguiente reacción química: 


PbNs + CrMn20; — Pb304 + Cr203 + MnO: + NO 


[M] La reacción química que aparece a continuación se puede 
utilizar en algunos procesos industriales, como la producción de 
arsénico (AsH3). Utilice aritmética exacta o un formato racional 
para los cálculos al balancear esta ecuación. 


MnS + As2Cr10035 + HS0, 
> HMnNoO, E AsH3 T CrS3012 + HO 


12. 


13. 


14. 
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Encuentre el patrón de flujo general de la red que se ilustra en la que se representa en la figura. (Las tasas de flujo están en 
figura. Suponiendo que todos los flujos son no negativos, ¿cuál vehículos/minuto). 
es el valor más pequeño posible para x4? b) Describa el patrón de tráfico general cuando está cerrada la 
B ruta cuyo flujo es xs. 
% 100 c) Cuando x5 = 0, ¿cuál es el valor mínimo de x4? 
A 
xı 23 
A * B 
PA 80 80 100 
€ x5 %2 
a) Encuentre el patrón de flujo general de la red que se ilustra 90 90 
en la figura. D x3 C 


b) Suponiendo que los flujos deben ser en los sentidos indica- 
dos, encuentre los flujos mínimos en las ramas denotadas 15. En Inglaterra las intersecciones con frecuencia se construyen 


COMO x2, X3, X4 Y X5. como circuitos en forma de glorieta de un solo sentido, como el 
que se ilustra en la figura. Suponga que el tráfico debe circular 
en los sentidos indicados. Encuentre la solución general del flu- 
jo de red. Determine el valor más pequeño posible para x6. 





a) Encuentre el patrón de tráfico general de la red de autopistas 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Escriba los porcentajes como decimales. Como todas las salidas deben tomarse en cuenta, 
cada columna debe sumar 1. Este hecho ayuda a llenar cualquier entrada faltante. 


Distribución de la producción por sectores: 








Agricultura Minería Manufactura Comprada por: 
65 20 20 Agricultura 
.05 .10 .30 Minería 
.30 .70 .50 Manufactura 


2. Como x5 <= 500, las ecuaciones D y A para xı y x2 implican que xı = 100 y x2 = 700. 
El hecho de que xs = 0 implica que xı = 600 y x2 = 200. Así, 100 = xı = 600, y 
200 = x, <= 700. 


1.7 | INDEPENDENCIA LINEAL 


Las ecuaciones homogéneas de la sección 1.5 se pueden estudiar desde una perspectiva dife- 
rente si las escribimos como ecuaciones vectoriales. De esta manera, la atención se transfiere 
de las soluciones desconocidas de Ax = 0 a los vectores que aparecen en las ecuaciones 
vectoriales. 
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Ecuaciones lineales en álgebra lineal 


Por ejemplo, considere la ecuación 


1 4 2 0 
xl|2|+x]|5|+x3|1|=]|0 (1) 
3 6 0 0 


Esta ecuación tiene una solución trivial, desde luego, donde xı = x2 = x3 = 0. Al igual que 
en la sección 1.5, el asunto principal es si la solución trivial es la única. 


DEFINICIÓN Se dice que un conjunto indexado de vectores {V1,..., Vp} en R” es linealmente inde- 


pendiente si la ecuación vectorial 
X1V1 + x2V2 + = + Xp = 0 


solo tiene la solución trivial. Se dice que el conjunto (v;,..., v,) es linealmente depen- 
diente si existen pesos c;,...,Cp, nO todos cero, tales que 


C1V1 =P C2V2 e CpÝp = 0 (2) 


La ecuación (2) se llama relación de dependencia lineal entre v;,..., v, cuando no todos 
los pesos son cero. Un conjunto indexado es linealmente dependiente si y solo si no es lineal- 
mente independiente. Por brevedad, puede decirse que v;,..., V, son linealmente dependientes 
cuando queremos decir que (v;,..., v,) es un conjunto linealmente dependiente. Se utiliza una 
terminología semejante para los conjuntos linealmente independientes. 


1 4 2 
EJEMPLO 1 Seanv,=| 2 |,v=| 5 |yv3i=| 1 
3 6 0 


a) Determine si el conjunto [v;, v2, V3) es linealmente independiente. 


b) Si es posible, encuentre una relación de dependencia lineal entre v1, V2 y V3. 


SOLUCIÓN 


a) Se debe determinar si existe una solución no trivial de la ecuación (1) que aparece más 
arriba. Las operaciones de fila sobre la matriz aumentada asociada indican que 


1.4.2.0 1 4 2 0 
2 5 1 0|=|0-3-3 0 
3 6 0 0 0o 0 0 0 


Como es evidente, xı y x2 son variables básicas, y x3 es libre. Cada valor de x3 distinto de 
cero determina una solución no trivial de (1). Así que vı, V2, V3 son linealmente depen- 
dientes (y, por tanto, no son linealmente independientes). 


b) Para encontrar una relación de dependencia lineal entre v1, V2 y V3, se reduce por filas 
completamente a la matriz aumentada y se escribe el nuevo sistema: 


1 0-2 0 X1 — 2x; =0 

0 1 1 (0) X2 + X3 = 0 

0o 0 0 0 0=0 
Así, xı = 2x3, X2 = —X3, y x3 es libre. Seleccione cualquier valor distinto de cero para x3; 
por ejemplo, x3 = 5. De esta manera, x¡ = 10 y x2 = —5. Sustituya estos valores en la 


ecuación (1) para obtener 
10v; = 5v2 + 5v3 =0 


Esta es una (entre una infinidad) de las posibles relaciones de dependencia lineal entre 
Vi, V2 Yy V3. E 
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Independencia lineal de las columnas de una matriz 


Suponga que, en vez de utilizar un conjunto de vectores, se inicia con una matriz 
A=[a; + ay]. En tal caso, la ecuación matricial Ax = 0 se puede escribir como 


xa + 129 + + Xpan = O 
Cada relación de dependencia lineal entre las columnas de A corresponde a una solución 


no trivial de Ax = 0. Así, tenemos el siguiente resultado importante. 


Las columnas de una matriz A son linealmente independientes si y solo si la ecuación 


Ax = Q tiene solo la solución trivial. (3) 
0 1 4 
EJEMPLO 2 Determine si las columnas de la matriz A = | 1 2 —1 | son lineal- 
5 8 0 


mente independientes. 


SOLUCIÓN Para estudiar Ax = 0, se reduce por filas la matriz aumentada: 


1 4 0 1 2—1 0 1 2—1 0 
1 2—1 0[=|0 1 4 OJ~JjO 1 4 Ọ 
8 0 0 02 5 0 0. 013 0 


En este punto, es claro que hay tres variables básicas y ninguna variable libre. Así, la 
ecuación Ax = 0 solo tiene la solución trivial, y las columnas de A son linealmente inde- 
pendientes. E 


Conjuntos de uno o dos vectores 


Un conjunto que solo tiene un vector —por ejemplo, v— es linealmente independiente si 
y solo si v no es el vector cero. Esto se debe a que la ecuación vectorial xv = 0 solo tiene 
la solución trivial cuando v % 0. El vector cero es linealmente dependiente porque x;0 = 0 
tiene muchas soluciones no triviales. 

El siguiente ejemplo explicará la naturaleza de un conjunto linealmente dependiente de 
dos vectores. 


EJEMPLO 3 Determine si los siguientes conjuntos de vectores son linealmente inde- 
pendientes. 


onsje] vefa] [E 


SOLUCIÓN 
a) Observe que vz es un múltiplo de vı, a saber, v2 = 2vı. Así que, —2v, + va = 0, lo 
que muestra que (v;, v2) es linealmente dependiente. 


b) Desde luego, los vectores vı y v2 no son múltiplos entre sí. ¿Podrían ser linealmente de- 
pendientes? Suponga que c y d satisfacen 


cy +dv,=0 


Si c + 0, entonces es posible despejar vı en términos de vz, a saber, vı = (—d/c)v2. 
Este resultado es imposible porque vı no es múltiplo de v2. Así que c debe ser cero. 
De manera similar, d también debe ser cero. Por lo tanto, {v1, V2} es un conjunto lineal- 
mente independiente. E 
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6,1) 


(6,2) 


X 


Linealmente dependientes 


(3, 2) 


(6, 2) 


X 


Linealmente independientes 


FIGURA 1 


TEOREMA 7 


Los argumentos del ejemplo 3 indican que siempre es posible determinar por inspección 
cuándo un conjunto de dos vectores es linealmente dependiente. Las operaciones de fila son 
innecesarias. Basta con comprobar si al menos uno de los vectores es un escalar multiplicado 
por el otro. (La prueba solo se aplica a conjuntos de dos vectores). 


Un conjunto de dos vectores {v1, V2} es linealmente dependiente si al menos uno de 
los vectores es un múltiplo del otro. El conjunto es linealmente independiente si y solo 
si ninguno de los vectores es un múltiplo del otro. 


En términos geométricos, dos vectores son linealmente dependientes si y solo si am- 
bos están sobre la misma recta que pasa por el origen. La figura 1 muestra los vectores del 
ejemplo 3. 


Conjuntos de dos o más vectores 


La prueba del siguiente teorema es similar a la solución del ejemplo 3. Los detalles se presen- 
tan al final de esta sección. 


Caracterización de conjuntos linealmente dependientes 


Un conjunto indexado S = {v1,..., Vp} de dos o más vectores es linealmente dependien- 
te si y solo si al menos uno de los vectores en 5 es una combinación lineal de los otros. 
De hecho, si S es linealmente dependiente y v, + 0, entonces alguna v; (con j > 1) es 
una combinación lineal de los vectores precedentes, v1,..., V;-1. 


Advertencia: El teorema 7 no dice que cada vector en un conjunto linealmente dependiente 
es una combinación lineal de los vectores precedentes. Un vector en un conjunto linealmente 
dependiente puede no ser combinación lineal de los otros vectores. Véase el problema de 
práctica 3. 


3 1 
EJEMPLO 4 Seanu=| 1 | y v=| 6 |. Describa el conjunto generado por u y v, 
0 0 


y explique por qué un vector w está en Gen {u, v} si y solo si {u, v, w} es linealmente 
dependiente. 


SOLUCIÓN Los vectores u y v son linealmente independientes porque ninguno de ellos 
es múltiplo del otro, de manera que generan un plano en R?. (Véase la sección 1.3). De hecho, 
Gen {u, vj] es el plano x¡x2 (con x3 = 0). Si w es una combinación lineal de u y v, enton- 
ces [u, v, w) es linealmente dependiente, de acuerdo con el teorema 7. A la inversa, su- 
ponga que (u, v, w)] es linealmente dependiente. Por el teorema 7, algún vector en {u, v, w} 
es una combinación lineal de los vectores precedentes (porque u + 0). Ese vector debe ser w, 
porque v no es múltiplo de u. Así, w está en Gen (u, v). Véase la figura 2. E 





3 
w 
l 
l 
k 
x 
“a l ey 2 
Xi 
Linealmente dependientes, Linealmente independientes, 
w en Gen {u, v} w no está en Gen {u, v} 


FIGURA 2 Dependencia lineal en [R3. 


TEOREMA 8 


FIGURA 3 
Si p > n, las columnas son 
linealmente dependientes. 


(2, 2) 


(2, 1) 





FIGURA 4 
Un conjunto linealmente 
dependiente en R?. 


TEOREMA 9 
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El ejemplo 4 se generaliza a cualquier conjunto {u, v, w} en R? con u y v linealmente 
independientes. El conjunto {u, v, w} será linealmente dependiente si y solo si w está en el 
plano generado por u y v. 

Los siguientes dos teoremas describen casos especiales en los cuales la dependencia 
lineal de un conjunto es automática. Aún más, el teorema 8 será un resultado clave para tra- 
bajar en capítulos posteriores. 


Si un conjunto contiene más vectores que entradas en cada vector, entonces el con- 
junto es linealmente dependiente. Es decir, cualquier conjunto {v1,..., Vp} en R” es li- 
nealmente dependiente si p > n. 


DEMOSTRACIÓN Sea A = [vi = vp]. Entonces, A es n x p, y la ecuación Ax = 0 co- 
rresponde a un sistema de n ecuaciones con p incógnitas. Si p > n, hay más variables que 
ecuaciones, por lo que debe existir una variable libre. Así, Ax = 0 tiene una solución no 
trivial, y las columnas de A son linealmente dependientes. Véase la figura 3 para una versión 
matricial de este teorema. E 


Advertencia: El teorema 8 no dice nada acerca del caso en que el número de vectores en el 
conjunto no excede el número de entradas en cada vector. 


4 
—1 
con el teorema 8, ya que hay tres vectores en el conjunto y solamente existen dos entradas en 
cada vector. Sin embargo, observe que ninguno de los vectores es un múltiplo de alguno de 
los otros. Véase la figura 4. E 


EJEMPLO 5 Los vectores | ii: | | | el son linealmente dependientes de acuerdo 


Si un conjunto S = {v1,..., Vp} en R” contiene al vector cero, entonces el conjunto es 
linealmente dependiente. 


DEMOSTRACIÓN Al renumerar los vectores, se puede suponer que vı = 0. Así, la ecuación 
1v; + 0v2 + + + Ov, = 0 indica que S es linealmente dependiente. E 


EJEMPLO 6 Por inspección, determine si el conjunto dado es linealmente dependiente. 


1] [2] f3] f4 2] fo] fi 5 a 
all aa b) |3|, Jof, |1 le Eo 
6| |9| [5] L8 5] Loj L8 Na iz 


SOLUCIÓN 


a) El conjunto contiene cuatro vectores, cada uno de los cuales tiene solamente tres entradas. 
Así que, de acuerdo con el teorema 8, el conjunto es linealmente dependiente. 


b) El teorema 8 no se aplica aquí porque el número de vectores no excede al número de 
entradas en cada vector. Como el vector cero se encuentra en el conjunto, este último es 
linealmente dependiente, de acuerdo con el teorema 9. 


c) Compare las entradas correspondientes de los dos vectores. El segundo vector parece ser 
el primer vector multiplicado por —3/2. La relación es válida para los primeros tres pares 
de entradas, pero falla para el cuarto par. Así, ninguno de los vectores es múltiplo de otro 
y, por lo tanto, son linealmente independientes. E 
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1r 


En los ejercicios 1 a 4, determine si los vectores son linealmente 
independientes. Justifique cada respuesta. 


5 
1. |0 
0 


E 


En los ejercicios 5 a 8, determine si las columnas de la matriz forman 
un conjunto linealmente independiente. Justifique sus respuestas. 


2 
3 


EJERCICIOS 


7 9 
| 2|,| 4 
—6 —8 


FE] 


2. 


4. 


En general, la sección se debería leer varias veces para asimilar plenamente un concepto 
tan importante como el de independencia lineal. Las notas en la Guía de estudio para esta 
sección ayudarán a construir imágenes mentales de las principales ideas de álgebra lineal. Por 
ejemplo, es importante leer con cuidado la siguiente demostración, ya que ilustra cómo se 
emplea la definición de independencia lineal. 


DEMOSTRACIÓN DEL TEOREMA 7 (Caracterización de conjuntos linealmente 
dependientes) Si alguna v;en S es una combinación lineal de los demás vectores, entonces 
v; se puede restar en ambos lados de la ecuación, produciendo así una relación de dependencia 
lineal con un peso diferente de cero (— 1) sobre v;. [Por ejemplo, si v; = c2v2 + c3v3, entonces 
0 = (=Dv1 + cava + c3v3 + Ova + +++ + Ov,.]. Por lo tanto, S es linealmente dependiente. 

A la inversa, suponga que $ es linealmente dependiente. Si vı es cero, entonces es una 
combinación lineal (trivial) de los demás vectores en S. De otra forma, v¡ + 0, y existen pesos 
C1,..., Cp, Sin que todos sean cero, tales que 


C1V1 + C2V2 + "e E Cpp = 0 


Sea j el subíndice más grande para el cual c; + 0. Si j = 1, entonces cıvı = 0, lo que es im- 
posible porque vı + 0. De manera que j > 1, y 


civi +e cev + 0vj41 ++" +0v,=0 
Civ; = =C1V1 — + — Cj-1Vj-1 
c Cj— 
Vj = (-2) Vi + de + (2) Vj- 
Cj Ej E 
PROBLEMAS DE PRÁCTICA 

3 —6 0 3 
Sean u = 2 |,v= 1]w=|-5|yz= VÍ 
—4 7 2 =5 

1. Determine si los siguientes conjuntos son linealmente independientes y explique por qué: 


{u, VJ, (UL, W),(U, Z),(V, W),(V, Z) y (W,Z). 
¿Las respuestas al problema 1 implican que (u, v, w, z) es linealmente independiente? 


Para determinar si {u, v, w, Z} es linealmente dependiente, ¿es aconsejable comprobar 
si, por ejemplo, w es una combinación lineal de u, v y z? 


¿El conjunto {u, v, w, Z} es linealmente dependiente? 


0-3 9 -4 g 0 

O E 0 -1 5 
3 E z 5 | i 4 5 e Lo Es 
2 llo 1 -4 -2 2 1-10 
3 -8 1 1 4-3 0 Lo=2 3-2 
r T O 8. |-2 4-6 2 
IS A 5 0 1-1 3 
3 P| —9 


En los ejercicios 9 y 10, a) ¿para qué valores de h está v3 en 
Gen {v1, V2}, y b) ¿para qué valores de h el conjunto {v1, V2, V3} 
es linealmente dependiente? Justifique sus respuestas. 


1 -3 5 

9, v = =3 » Ya = 9 . V3 = —7 
2 —6 h 

1 -3 2 

10. v = —3 » vo = 9 s V3 = —5 
=5 15 h 


En los ejercicios 11 a 14, encuentre el valor o valores de h para 
los cuales los vectores son linealmente dependientes. Justifique sus 
respuestas. 


2 4 —2 3 —6 9 

11 —2 |,| —6 j, 2 12. | —6 |, 4 |,| h 
4 7 h 1 —3 3 

1 z2 3 1 —3 2 

13. 51,|=9 |, h 14. | -2 |, Ts ll 
3 6 —9 —4 6 h 


Por inspección, determine si los vectores en los ejercicios 15 a 20 
son linealmente independientes. Justifique sus respuestas. 


2 -3 
15. le 16 | Ll 6 
8 =f? 
5 0 =} 
17. | -3 |, |o], | 2 18. PPE EIH 
=j 0 4 
-8 2 1 e, 0 
19. | 12 |,| -3 20. | 41 | 5,10 
-4 zi q 3 0 


En los ejercicios 21 y 22, marque cada enunciado como verdadero 
o falso. Justifique cada respuesta con base en una cuidadosa lectura 
del texto. 


21. a) Las columnas de una matriz A son linealmente independien- 
tes si la ecuación Ax = 0 tiene la solución trivial. 


b) Si S es un conjunto linealmente dependiente, entonces cada 
vector es una combinación lineal de los otros vectores en S. 

c) Las columnas de cualquier matriz de 4 x 5 son linealmente 
dependientes. 

d) Si x y y son linealmente independientes, y si {x, y, Z} es 
linealmente dependiente, entonces z está en Gen {x, y}. 


22. a) Si u y v son linealmente independientes, y si w está en 
Gen {u, v}, entonces {u, v, w} es linealmente dependiente. 

b) Si tres vectores en R? están en el mismo plano en R3, enton- 
ces son linealmente dependientes. 

c) Si un conjunto contiene menos vectores que entradas en 
los vectores, entonces el conjunto es linealmente indepen- 
diente. 

d) Si un conjunto en R” es linealmente dependiente, entonces 
el conjunto contiene más de n vectores. 


En los ejercicios 23 a 26, describa las posibles formas escalonadas de 
la matriz. Utilice la notación del ejemplo 1 de la sección 1.2. 


23. A es una matriz de 2 x 2 con columnas linealmente depen- 
dientes. 


24. A es una matriz de 3 x 3 con columnas linealmente inde- 
pendientes. 
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25. A es una matriz de 4 x 2, A = [aj 
de a. 


a2], y a2 no es múltiplo 


26. A es una matriz de 4 x 3, A = [a] a as], tal que {a;, a2} es 
linealmente independiente y az no está en Gen {a;, a2}. 


27. ¿Cuántas columnas pivote debe tener una matriz de 6 x 4 si 
sus columnas son linealmente independientes? ¿Por qué? 


28. ¿Cuántas columnas pivote debe tener una matriz de 4 x 6 si sus 
columnas generan a [R*? ¿Por qué? 


29. Construya matrices A y B de 3 x 2 tales que Ax = 0 tenga 
una solución no trivial, pero Bx = 0 tenga solamente la solu- 
ción trivial. 

30. a) Llene el espacio del siguiente enunciado: “Si A es una matriz 

de m x n, entonces las columnas de A son linealmente inde- 
pendientes si y solo si A tiene columnas pivote”. 


b) Explique por qué es verdadero el enunciado en a). 


Los ejercicios 31 y 32 deberían resolverse sin efectuar operaciones 
de fila. [Sugerencia: Escriba Ax = Ó como una ecuación vectorial]. 


2. -35 
; =5 1 - 
31. A partir de A = le a 4b observe que la tercera co- 
1 0 1 | 


lumna es la suma de las dos primeras. Encuentre una solución 
no trivial de Ax = 0. 
4 3 -5 
2. A partir de A = | —2 -2 4 |, observe que la primera 
2 3 7 
columna menos la segunda multiplicada por 3 es igual a la ter- 
cera columna. Determine una solución no trivial de Ax = 0. 


w 


En los ejercicios 33 a 38 cada enunciado es verdadero (en todos los 
casos) o falso (para al menos un ejemplo). Si es falso, idee un ejem- 
plo específico para demostrar que el enunciado no siempre es válido. 
Tal ejemplo se llama contraejemplo del enunciado. Si un enunciado 
es verdadero, dé una justificación. (Un ejemplo específico no puede 
explicar por qué un enunciado siempre es verdadero. Aquí es necesa- 
rio realizar más trabajo que en los ejercicios 21 y 22). 


33. Si v1,..., V4 están en R4, y v3 = 2v; + vz, entonces {V1, V2, V3, V4} 
es linealmente dependiente. 





34. Si vı y v2 están en R4 y v2 no es un múltiplo escalar de vı, en- 
tonces {v1, V2} es linealmente independiente. 


35. Si y;,..., vs están en R3 y yz = 0, entonces {V1, V2, V3, V4, V5} 
es linealmente dependiente. 





36. Si v;, va, v3 están en [R3 y v3 no es combinación lineal de v1, v2, 
entonces {V1, V2, V3} es linealmente independiente. 


37. Si vı,..., V4 están en R4, y [v1, V2, V3} es linealmente depen- 
diente, entonces {V1, V2, V3, V4} también es linealmente de- 
pendiente. 


38. Si {v1,...,V4} es un conjunto linealmente independiente de 
vectores en R4, entonces {v1, V2, V3} también es linealmente 
independiente. [Sugerencia: Piense en xıvı + x2V2 + x3V3 + 
0- v4,=0]. 


39. Suponga que A es una matriz de m x n tal que para toda b 
en R” la ecuación Ax = b tiene, a lo sumo, una solución. 
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Use la definición de independencia lineal para explicar por 12 10 -6 8 4 —14 
qué las columnas de A deben ser linealmente independientes. -7 —6 4 -5 -7 9 
40. Suponga que una matriz A de m x n tiene n columnas pivote. Baks ; 2 a s m 
Explique por qué para cada b en R” la ecuación Ax = b tiene, 8 7-5 6 ia 


a lo sumo, una solución. [Sugerencia: Explique por qué Ax = b 


no puede tener un número infinito de soluciones]. 43. [M] Con A y B del ejercicio 41, seleccione una columna v de A 
[M] En los ejercicios 41 y 42, utilice tantas columnas de A como que no se haya utilizado en la construcción de B y determine si 
sea posible para construir una matriz B tal que la ecuación Bx = 0 v está en el conjunto generado por las columnas de B. (Describa 
sólo tenga la solución trivial. Para comprobar su trabajo, resuelva sus cálculos). 
Bx=0. 44. [M] Repita el ejercicio 43 con las matrices A y B del ejerci- 
3 4 10 7 -4 cio 42. Luego, dé una explicación del resultado, suponiendo que 
41. A= —5 =3 -7-11 15 B se construyó de acuerdo con las especificaciones. 
i 4 3 5 2 1 
8 7 23 4 15 
x SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


2. No. La observación en el problema de práctica 1, por sí misma, no dice nada sobre la 
independencia lineal de {u, v, w, Z}. 


3. No. Cuando se comprueba la independencia lineal, por lo general es poco útil la idea 
de comprobar si un vector seleccionado es una combinación lineal de los demás. Puede 
ocurrir que el vector seleccionado no sea una combinación lineal de los otros y, aun así, 
el conjunto entero de vectores sea linealmente dependiente. En este problema de práctica, 


% 2 w no es una combinación lineal de u, v y Z. 


3 
1. Sí. En cada caso, ningún vector es múltiplo del otro. Por lo tanto, cada conjunto es lineal- 
mente independiente. 
xX. 


4. Sí, de acuerdo con el teorema 8. Existen más vectores (cuatro) que entradas (tres) en 
ellos. 


1.8 | INTRODUCCIÓN A LAS TRANSFORMACIONES LINEALES 


La diferencia entre una ecuación matricial Ax = b y la ecuación vectorial asociada 
xa; + 0 + X,an = b es tan solo cuestión de notación. Sin embargo, es posible encontrar 
una ecuación matricial Ax = b en álgebra lineal (y en aplicaciones como gráficos genera- 
dos por computadora y procesamiento de señales) que no esté directamente relacionada con 
combinaciones lineales de vectores. Esto sucede cuando se piensa en la matriz A como un 
objeto que “actúa” sobre un vector x multiplicándolo para producir un nuevo vector Ax. 


Por ejemplo, en las ecuaciones 


A —> e a a 


se Observa que la multiplicación por A transforma a x en b, y transforma a u en el vector cero. 
Véase la figura 1. 
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multiplicación 
por A 
xs b 
0 multiplicación 
. 
por A 
u 2 
R Re 


FIGURA 1 Transformación de vectores por 
medio de multiplicación matricial. 


Desde este nuevo punto de vista, resolver la ecuación Ax = b equivale a encontrar todos 
los vectores x en R4 que se transforman en el vector b en R? como resultado de la “acción” 
de la multiplicación por A. 

La correspondencia de x a Ax es una función de un conjunto de vectores a otro. Este con- 
cepto generaliza la noción común de una función como una regla que transforma un número 
real en otro. 

Una transformación (o función o mapeo) T de R” a R” es una regla que asigna a cada 
vector x en R” un vector T(x) en R”. El conjunto R” se llama el dominio de T, y R” se Ilama 
el codominio de T. La notación T : R” —> R” indica que el dominio de T es R” y que el co- 
dominio es R”. Para x en R”, el vector T(x) en R” es la imagen de x (bajo la acción de T). 
El conjunto de todas las imágenes T(x) es el rango de T. Véase la figura 2. 

















Dominio Codominio 


FIGURA 2 Dominio, codominio y rango 
de T : R” —> R”. 


Es muy importante la nueva terminología de esta sección porque un enfoque dinámico 
del producto matriz-vector es la clave para entender diversas ideas en álgebra lineal, y para 
construir modelos matemáticos de sistemas físicos que evolucionan en el tiempo. Estos siste- 
mas dinámicos se analizarán en las secciones 1.10, 4.8 y 4.9, así como en el capítulo 5. 


Transformaciones matriciales 


Lo que resta de esta sección se centra en mapeos asociados con la multiplicación matricial. 
Para cada x en R”, T(x) se calcula como Ax, donde A es una matriz de m x n. Para simpli- 
ficar, algunas veces esta transformación matricial se denota como x > Ax. Observe que el 
dominio de T es R” cuando A tiene n columnas, y el codominio de T es R” cuando cada co- 
lumna de A tiene m entradas. El rango de T es el conjunto de todas las combinaciones lineales 
de las columnas de A, porque cada imagen T(x) es de la forma Ax. 
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1 -—3 2 3 3 
EJEMPLO 1 Sean A = 3 5 ael | »= 2 |, c= | 2 |, y defina 
—1 
-1 7 —5 5 
una transformación T : R? x R? por T(x) = Ax, de manera que 
1 —3 w NTS 3x2 
a TO) =A4Ax=| 3 5 [3]- 3x1 + 5x2 
1. 7] —x1 + 7x2 
a) Encuentre 7(u), la imagen de u bajo la transformación T. 
b) Encuentre una x en R? cuya imagen bajo T sea b. 
c) Hay más de una x cuya imagen bajo T sea b? 
T d) Determine si ¢ está en el rango de la transformación T. 
x SOLUCIÓN 
a) Calcule 
y [r= 2 5 
X, . T(u) = Au = 3 2) | |= 1 
=p 7 ]|b- 1 


b) Resuelva T(x) = b para x. Es decir, resuelva Ax = b, o 


J E "j= o) 
i -| 


Tu) = =1 7 5 


Oeu 


Empleando el método analizado en la sección 1.4, reduzca por filas la matriz aumen- 


tada: 
1 -3 3 1 -3 3 1-3 3 1 0 1.5 
5 2|=|0 14 -7|Į|~]|0 1—5ļjļ~] 0  1-—.5 (2) 
-1 7 5 0 4-2 0 0 0 0 0 


Así que xı = 1.5, x2 = —.5 y x = E 
b dado. 


c) Cualquier x cuya imagen bajo T es b debe satisfacer la ecuación (1). A partir de (2), es 
evidente que la ecuación (1) tiene una solución única, por lo que hay exactamente una x 
cuya imagen es b. 


| La imagen de esta x bajo T es el vector 


d) El vector e está en el rango de T si e es la imagen de alguna x en R?, es decir, si e = T(x) 
para alguna x. Esto es justamente otra manera de preguntar si el sistema Ax = e es con- 
sistente. Para encontrar la respuesta, reduzca por filas la matriz aumentada: 


1 -3 3 1.39 3 1-3 3 1 —=3 3 

3 5 2|-=]0 14 7|=|f0 1 2|=]|0. 1 2 

=Le MM. 23 0.4 8 0 14 -7 0 0-35 
La tercera ecuación, O = —35, indica que el sistema es inconsistente. De manera que c 
no está en el rango de T. E 


La pregunta del ejemplo 1c) es un problema de unicidad para un sistema de ecuacio- 
nes lineales, traducido aquí al lenguaje de transformaciones lineales: ¿Es b la imagen de una 
única x en R"? De manera similar, el ejemplo 1d) es un problema de existencia: ¿Existe 
una x cuya imagen sea c? 

Las siguientes dos transformaciones matriciales se pueden visualizar geométricamente. 
Ambas refuerzan el enfoque dinámico de una matriz como algo que transforma vectores en 
otros vectores. La sección 2.7 incluye otros interesantes ejemplos relacionados con los gráfi- 
cos generados por computadora. 





FIGURA 3 
Una transformación proyección. 


>" a 
EL.” 5 
` / 
borrego 





borrego deformado por una 
transformación de trasquilado 


DEFINICIÓN 
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1.0.0 
EJEMPLO 2 SiA=|0 1 0 |, entonces la transformación Xx —> Ax proyecta 
0. 0.0 


puntos de R* sobre el plano xx, porque 


X1 1 0 X1 X1 
x|>|p0 1 0 x2 |=| x2 
X3 0 0 X3 0 
Véase la figura 3. E 


EJEMPLO 3 Sea A= | AS l La transformación T : R? — R? definida por T(x) = Ax 


0 1 


se llama una transformación de trasquilado. Se puede demostrar que si T actúa sobre cada 
punto del cuadrado 2 x 2 que se ilustra en la figura 4, entonces el conjunto de imágenes for- 
ma el paralelogramo sombreado. La idea fundamental es demostrar que T mapea segmentos 
de recta sobre segmentos de recta (como se muestra en el ejercicio 27) y después comprobar 
que los vértices del cuadrado se mapean sobre los vértices del paralelogramo. Por ejemplo, 


la imagen del punto u = B es T(u) = lo ll = a y la imagen de a dd 


| ' i | | 3 = | Al T deforma el cuadrado como si la parte superior de este se empujara 


hacia la derecha manteniendo fija la base. La transformación de trasquilado se presenta en 
física, geología y cristalografía. E 


X Xj 








X 


Zi 
2 2 


FIGURA 4 Una transformación de trasquilado. 


Transformaciones lineales 


El teorema 5 de la sección 1.4 establece que si A es de m x n, entonces la transformación 
x > Ax tiene las propiedades 


A(u+v)=4Au+Av y A(cu)= cAu 


para toda u, v en R” y todos los escalares c. Estas propiedades, expresadas en notación fun- 
cional, identifican a la más importante clase de transformaciones en álgebra lineal. 


Una transformación (o mapeo) T es lineal si: 


i. T(u + v) = T(u) + 7(v) para todas las u, v en el dominio de T; 
li. 7(cu) = cT(u) para todos los escalares c y para todas las u en el dominio de T. 


Cada transformación matricial es una transformación lineal. En los capítulos 4 y 5 se 
analizarán importantes ejemplos de transformaciones lineales que no son transformaciones 
matriciales. 


66 CAPÍTULO 1 Ecuaciones lineales en álgebra lineal 


Las transformaciones lineales preservan las operaciones de suma vectorial y multiplica- 
ción escalar. La propiedad i dice que el resultado T(u + v) de primero sumar u y v en R” y 
después aplicar T es lo mismo que primero aplicar T a u y v, y luego sumar T(u) y T(v) en R”. 
Esas dos propiedades conducen fácilmente a los siguientes útiles resultados. 


Si T es una transformación lineal, entonces 


T(0) =0 6) 


T(cu + dv) = cT(u) + dT(v) (4) 


para todos los vectores u, v en el dominio de T y para todos los escalares c, d. 


La propiedad (3) se deriva de la condición ii en la definición, porque 7(0) = T(0u) = 
07(u) = 0. La propiedad (4) requiere tanto de i como de ii: 


T(cu + dv) = T(cu) + T(dv) = cT(u) + dT(v) 


Observe que si una transformación satisface la ecuación (4) para cualesquiera u, Y y c, d, 
entonces debe ser lineal. (Establezca c = d = 1 para preservación de la suma, y d = O para 
preservación de la multiplicación escalar). La aplicación repetida de (4) produce una útil 
generalización: 


MA E CST) (5) 


En física e ingeniería, la ecuación (5) se conoce como principio de superposición. Piense 
que vj,..., V)» SON señales que entran a un sistema y 7(v1),..., T(v,) son las respuestas de ese 
sistema a las señales. El sistema satisface el principio de superposición si para cualquier 
entrada expresada como una combinación lineal de tales señales, la respuesta del sistema 
es la misma combinación lineal de las respuestas a las señales individuales. En el capítulo 4 
retomaremos esta idea. 


EJEMPLO 4 Dado un escalar r, defina T : R? —> R? por T(x) = rx. T se llama una con- 
tracción cuando O < r < 1, y una dilatación cuando r > 1. Sea r = 3, y demuestre que T 
es una transformación lineal. 


SOLUCIÓN Sean u, v en R2 y sean c, d escalares. De esta forma, 
T(cu + dv) = 3(cu+ dv) Definición de T 
= 3cu + 3dv 
= cu) + d(3v) 
=CT(u) + dT(v) 


Aritmética vectorial 


Así, T es una transformación lineal porque satisface (4). Véase la figura 5. E 


e T T(u) 





X 


FIGURA 5 Una transformación de dilatación. 
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EJEMPLO 5  Defina una transformación T : R? > R? mediante 
= O —1 X|_ | Xx 
tasj ala El a] 


Encuentre las imágenes bajo T de u = [1] "- El yu+v= i 


SOLUCIÓN 
0 —1 || 4 -1 0 —1]||2 -3 
==) ro- 1 Jls]-[5 
0 —1 || 6 —4 
rarv=[i al[s] 
Observe que T(u + v), evidentemente, es igual a T(u) + T(v). En la figura 6 es claro que T 
hace girar a u, v y u + v en el sentido antihorario, en torno al origen, en un ángulo de 90°, 


De hecho, T transforma el paralelogramo entero determinado por u y v en el determinado por 
T(wy T(v). (Véase el ejercicio 28). A 


T(u + v) 


T(W) + 








FIGURA 6 Una transformación de rotación. 


El ejemplo final no es geométrico, sino que muestra cómo un mapeo lineal puede trans- 
formar un tipo de datos en otro. 


EJEMPLO 6 Una compañía fabrica dos productos, B y C. Utilizando los datos del ejem- 
plo 7 de la sección 1.3, construya una matriz de “costo unitario”, U = [b c], cuyas columnas 
describan los “costos por dólar de producción” para ambos bienes: 


Producto 
B C 
.45 .40 | Materiales 
U = | .25 .35 | Mano de obra 
.15 .15 | Gastos indirectos 


Sea x = (x1, x2) el vector de “producción”, correspondiente a xı dólares del producto B y 
a x2 dólares del producto C, y defina T : R? —> R? mediante 


.45 .40 Costo total de materiales 
T(x) = Ux = xı| .25 | +x2| .30 | = | Costo total de mano de obra 
.15 .15 Costo total de gastos indirectos 


El mapeo T transforma una lista de cantidades de producción (medidas en dólares) en una 
lista de costos totales. La linealidad de este mapeo se refleja de dos maneras: 


1. Si la producción se incrementa en un factor de, por ejemplo, 4, de x a 4x, entonces los 
costos se incrementarán por el mismo factor, de T(x) a 4T(x). 
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2. Si x y y son vectores de producción, entonces el vector de costo total asociado con 
la producción combinada x + y es precisamente la suma de los vectores de costo T(x) 


y T(y). 


PROBLEMAS DE PRÁCTICA 


1. Suponga que T : R — R? y T(x) = Ax para alguna matriz A y para cada x en R5. ¿Cuántas 


filas y columnas tiene A? 


1 


2. saa =la 


Ll Dé una descripción geométrica de la transformación x > AX. 


3. El segmento de recta de 0 a un vector u es el conjunto de puntos de la forma tu, donde 
0 = £ <= 1. Demuestre que una transformación lineal 7 mapea este segmento en el seg- 


mento entre 0 y T(u). 


1.8 EJERCICIOS 


1. Sea A = la | y defina T : R? — R? por T(x) = Ax. 


; a 1 
Encuentre las imágenes bajo T de u = | 3 | yy= l; | 


b 
z= 0 0 3 a 
2. SeaA=]| 0 i 0|, u= 6lyv=]|b 
0 0 3 -9 c 


Defina T : R? —> R? por T(x) = Ax. Encuentre T(u) y T(v). 


En los ejercicios 3 a 6, con T definida por T(x) = Ax, encuentre un 
vector x cuya imagen bajo T sea b, y analice si x es único. 


Ede -2 
3. A=|-3 1 6|b=| 3 
AS | -1 
1 -2 3 —6 
4 A=|0 1 -3|b=|-4 
2 -5 6 -5 
DE =9 
5 4=[_, 7 5) 0=[3] 
1 -3 2 1 
3 -8 8 6 
Sáslo i a PeT] 33 
1 0 8 10 


7. Sea A una matriz de 6 x 5. ¿Qué valores de a y b permiten de- 
finir T : Rf —> R? mediante T(x) = Ax? 


8. ¿Cuántas filas y columnas debe tener una matriz A para poder 
definir un mapeo de R5 a R? con la regla T(x) = Ax? 


Para los ejercicios 9 y 10, encuentre todos los vectores x en R4 que 
son mapeados en el vector cero por la transformación x > Ax para 
la matriz A dada. 


1 -3 5 -5 
9 A=|0 1-3 5 
2 —4 4 —4 


3 2 10 | 
1 0 2 —4 
10. A= o 1 > 3 
1 4 10 8 | 
-1 
11. Sean b = 1 |, y A la matriz del ejercicio 9. ¿b está en el 


0 
rango de la transformación lineal x > Ax? ¿Por qué? 
-1 
3 
-1 
4 
el rango de la transformación lineal x > Ax? ¿Por qué? 


12. Sean b = , y A la matriz del ejercicio 10. ¿b está en 


En los ejercicios 13 a 16, utilice un sistema de coordenadas rec- 
5 —2 Lis ; 
tangulares para graficar u = 2 |Y =| 4 |» y Sus imágenes bajo 


la transformación T dada. (Elabore un esquema grande y separado 
para cada ejercicio). Describa geométricamente lo que hace T a cada 
vector x en R?. 


13. r09=|7, A] 
14. tosl A 
15. re=|; AE 


16. TH) = le ES 


17. Sea T: R? — R? una transformación lineal que mapea u = | l 


en H y mapea v = [3| en E | Considerando el hecho 


de que T es lineal, encuentre las imágenes bajo T de 2u, 3v y 
2u + 3v. 


18. La figura muestra los vectores u, v y w, junto con las imá- 
genes T(u) y T(v) bajo la acción de una transformación lineal 
T : R? > R?. Copie esta figura cuidadosamente, y dibuje la 
imagen de 7(w) con la mayor exactitud posible. [Sugerencia: 
Primero, escriba w como una combinación lineal de u y v.] 


xX, xX 


Wi u T(v) 





Tu) 


1 0 2 -1 
19. Sean e; = [y ).e.- HES o y | al y sea 


T : R? — R? una transformación lineal que mapea e, en y;, y e> 


en y2. Encuentre las imágenes de | E y | a | 
= 2 


zhi Aaa SEN . R2 2 
20. sex = [| y =| syys [aysar >R 


una transformación lineal que mapea x en xıVı + x2V2. Encuen- 
tre una matriz A tal que T(x) sea Ax para cada x. 


En los ejercicios 21 y 22, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 
21. a) Una transformación lineal es un tipo especial de función. 


b) Si A es una matriz de 3 x 5, y T es una transformación defi- 
nida por T(x) = Ax, entonces el dominio de T es RÈ. 


c) Si A es una matriz de m x n, entonces el rango de la trans- 
formación x > Ax es R”. 


d) Cada transformación lineal es una transformación matricial. 

e) Una transformación T es lineal si y solo si 
T(ciV1 + c2V2) = c1T(v1) + c2T(v2) 
para cualesquiera vı y v2 en el dominio de T y para todos los 
escalares c1 y c2. 

22. a) El rango de la transformación x > Ax es el conjunto de to- 

das las combinaciones lineales de las columnas de A. 

b) Cada transformación matricial es una transformación lineal. 


c) SiT: R” — R” es una transformación lineal y si e está en R”, 
entonces una pregunta de unicidad es: “¿Está e en el rango 
de T?”. 


d) Una transformación lineal preserva las operaciones de suma 
vectorial y multiplicación escalar. 
e) Una transformación lineal T : R" > R” siempre mapea el 
origen de R” al origen de R”. 
23. Defina f: R — R por fx) = mx + b. 
a) Demuestre que f es una transformación lineal cuando b = 0. 


b) Encuentre una propiedad de una transformación lineal que 
se viole cuando b + 0. 


c) ¿Por qué f se llama una función lineal? 
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24. Una transformación afín T : R" —> R” tiene la forma T(x) = Ax 
+ b, donde A es una matriz de m x n y b está en R”. Demuestre 
que T no es una transformación lineal cuando b + 0. (Las trans- 
formaciones afines son importantes en los gráficos generados 
por computadora). 


25. Dados v + 0 y p en R”, la recta que pasa por p en la dirección 
de v tiene la ecuación paramétrica x = p + tv. Demuestre que 
una transformación lineal T : R” —> R” mapea esta recta sobre 
otra recta o sobre un solo punto (una recta degenerada). 


26. a) Demuestre que la recta que pasa por los vectores p y q 
en R” se puede escribir en la forma paramétrica x = (1 — 
tp + tq. (Consulte la figura de los ejercicios 21 y 22 de 
la sección 1.5). 


b) El segmento de recta de p a q es el conjunto de puntos de la 
forma (1 — £f)p + tq para O = 1 = 1 (como que se muestra 
en la figura de abajo). Demuestre que una transformación 
lineal T mapea este segmento de recta sobre un segmento de 
recta o sobre un solo punto. 


@=0)p T(q) 


X 
(1-Dp+1 Tœ) 


T(p) 
(=D q 


27. Sean u y v vectores linealmente independientes en R3, y sea P 
el plano que pasa por u, y y 0. La ecuación paramétrica de P es 
x = su + ty (con s, t en R). Demuestre que una transformación 
lineal T : R? — R? mapea P sobre un plano a través de 0, o sobre 
una recta que pasa por 0, o justo sobre el origen en R3. ¿Qué se 
puede decir acerca de T(u) y T(v) para que la imagen del plano 
P sea un plano? 


28. Sean u y v vectores en R”. Es posible demostrar que el conjun- 
to P de todos los puntos en el paralelogramo determinado por 
u y v tiene la forma au + bv, para 0 Sa =£ 1,0 Sb < 1. Sea 
T : R” —> R” una transformación lineal. Explique por qué la 
imagen, bajo la transformación T, de un punto en P está en el 
paralelogramo determinado por T(u) y T(v). 


29. Sea T: R? — R? la transformación lineal que refleja cada pun- 
to a través del eje x2. Elabore dos esquemas semejantes a la fi- 
gura 6, que ilustren las propiedades i y ii de una transformación 
lineal. 


30. Suponga que los vectores v1,..., Vp generan a R”, y que T : R" —> R” 
es una transformación lineal. Considere que T(v) = 0 para 
i = 1,..., p. Demuestre que T es la transformación cero. Es decir, 
demuestre que si x es cualquier vector en R”, entonces T(x) = 0. 


31. Sea T: R” — R” una transformación lineal, y sea {V1, V2, V3} 
un conjunto linealmente dependiente en R”. Explique por qué 
el conjunto {T(v1), T(v2), T(v3)} es linealmente dependiente. 


En los ejercicios 32 a 36, los vectores columna están escritos como 
filas, como x = (x1, x2), y T(x) se escribe como T(x1, x2). 


32. Demuestre que la transformación T definida por T(x1, x2) = 
(xı — 2p], xı — 4x2) no es lineal. 


33. Demuestre que la transformación T definida por T(x1, x2) = 
(e — 2x2, x1 — 3, 2x1 — 5x2) no es lineal. 
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34. Sea T : R? —> R? la transformación que refleja a cada vector 2 3 5-5 3 4 7 0 
X = (x1, X2, x3) a través del plano x3 = O sobre T(x) = (x1, x2, —x3). —7 T 0 0 5 —8 7 4 
D E 37. 38. 
emuestre que T es una transformación lineal. [Para algunas -3 4 1 3 6-8 6 4 
ideas, véase el ejemplo 4]. —9 3 —6 —4 a a A. 
35. Sea T: R? — R? la transformación que proyecta a cada vector 8 
il 


Xx = (x1, X2, X3) sobre el plano xz = 0, de manera que T(x) = 39. [M] Sea b= 


aN sea A la matriz del ejercicio 37. 
(xı, 0, x3). Demuestre que T es una transformación lineal. a J 


u 


=3 
¿Está b en el rango de la transformación x > Ax? Si es así, 
obtenga una x cuya imagen bajo la transformación sea b. 


36. Sea T: R” — R” una transformación lineal. Suponga que {u, v} 
es un conjunto linealmente independiente, pero {T(u), T(v)} es 
un conjunto linealmente dependiente. Demuestre que 7(x) = 0 


tiene una solución no trivial. [Sugerencia: Considere el hecho a 
de que c¡T(u) + c2T(v) = 0 para algunos pesos c1 y c2, sin que 40. [M] Sea b = 4 | Y sea A la matriz del ejercicio 38. 
ambos sean iguales a cero]. 7 
[M] En los ejercicios 37 y 38, las matrices determinan una transfor- ¿Está b en el rango de la transformación x > Ax? Si así es, 
mación lineal T. Encuentre todas las x tales que T(x) = 0. encuentre una x cuya imagen bajo la transformación sea b. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. A debe tener cinco columnas para que Ax esté definido. A debe tener dos filas para que 





Au el codominio de T esté en R?. 
y + . 2. Dibuje algunos puntos aleatorios (vectores) sobre papel milimétrico para ver qué ocurre. 
HA Un punto como (4, 1) se mapea en (4, —1). La transformación x > Ax refleja los puntos 
Av T l Ax a través del eje x (o eje x1). 
m 3. Sea x = fu para alguna 1 tal que 0 < 1 < 1. Como T es lineal, entonces T(tu) = tT(u), 
La transformación x > AX. que es un punto sobre el segmento de línea entre 0 y T(u). 


1.9 | MATRIZ DE UNA TRANSFORMACIÓN LINEAL 


Siempre que una transformación lineal T se origina geométricamente o se describe con pa- 
labras, surge el deseo de tener una “fórmula” para T(x). El análisis que sigue muestra que 
cada transformación lineal de R” a R” en realidad es una transformación matricial x > Ax, 
y que importantes propiedades de T están íntimamente relacionadas con propiedades de A. 
La clave para encontrar A es observar que T está plenamente determinada por su acción so- 
bre las columnas de la matriz identidad de n x n, In. 


EJEMPLO 1 Las columnas de /, = Lo d son €; = E y & = El Suponga 


que T es una transformación lineal de R? a R? tal que 





e,=|2] 5 =3 
T(e)=|-7| y Tle)=| 8 
2 0 
èi =[1] Sin otra información adicional, encuentre una fórmula para la imagen de una x arbitraria 
alg E 
en R4. 
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SOLUCIÓN Escriba 


1 0 
x= 0 | 00 o +32] y] 00143002 (1) 


Como T es una transformación lineal, 


T(x) = xıT (e1) + x2T (e2) (2) 
5 3 5x1 — 3x2 
=x|-7|+x 8 | =| —7x1 + 8x2 E 
2 0 2x1+0 


El paso de la ecuación (1) a la ecuación (2) explica por qué el conocimiento de T(e1) y 
T(e>) es suficiente para determinar T(x) para cualquier x. Además, ya que (2) expresa a T(x) 
como una combinación lineal de vectores, podemos colocar esos vectores en las columnas 
de una matriz A y así escribir (2) como 


T(x) =[T(e1)  T(e)] Es = Ax 


TEOREMA 10 Sea T : R” —> R” una transformación lineal. Así, existe una única matriz A tal que 
T(x) = Ax para toda x en R” 


De hecho, A es la matriz de m x n cuya j-ésima columna es el vector T(e;), donde ej 
es la j-ésima columna de la matriz identidad en R”: 


A=[Te1) + T(e,)] 6) 


DEMOSTRACIÓN Escriba x = „x = [e] “+ en]X = xie; + +t + Xren, y utilice la linea- 
lidad de T para calcular 


T(x) = T (x161 +: + Xren) = xT (e1) +- + Xn T (en) 


X1 
=[T@) = Te)]| : |=4x 
Xn 
En el ejercicio 33 nos ocuparemos de la unicidad de A. E 


La matriz A en (3) se llama matriz estándar para la transformación lineal 7. 

Ahora se sabe que cada transformación lineal de R” a R” puede verse como una transfor- 
mación matricial, y viceversa. El término transformación lineal se enfoca sobre una propie- 
dad de un mapeo, mientras que la transformación matricial describe cómo se implementa tal 
mapeo, lo que se ilustra en los ejemplos 2 y 3. 


EJEMPLO 2 Encuentre la matriz estándar A para la transformación de dilatación T(x) = 3x, 
para x en R?. 
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m 


FIGURA 2 El cuadrado unitario. 


SOLUCIÓN Escriba 


Tte) =3 = || y Te) =32= [5 
HA 


a= l a 


EJEMPLO 3 Sea T: R? > R? la transformación que hace girar a cada punto de R? alre- 
dedor del origen un ángulo Q, en sentido antihorario, si p es positivo. Geométricamente, se 
podría demostrar que esta transformación es lineal. (Véase la figura 6 de la sección 1.8). 
Encuentre la matriz estándar A de esta transformación. 


z 11. cos Q 1|. —sen p A 
SOLUCION 9 | giraal sn p |? y[p|giraal cos o'l Véase la figura 1. Por el teo- 


rema 10, 


_ [cose —senọ 
~ | seng cos o 


El ejemplo 5 de la sección 1.8 es un caso especial de esta transformación, con p = 7/2. W 


% 





(=sen p, cos p)_ (0, 1) 
| NS 
Y My 
/ al N 
de X Cos (p, sen p) 
| ie 4 5 
1 1(1, 0) l 
\ / 


FIGURA 1 Una transformación de rotación. 


Transformaciones lineales geométricas de R? 


Los ejemplos 2 y 3 ilustran transformaciones lineales que se describen geométricamente. 
Las tablas 1 a 4 muestran otras transformaciones lineales geométricas comunes del plano. 
Como las transformaciones son lineales, estas quedan completamente determinadas por su 
acción sobre las columnas de 7. En vez de solo mostrar las imágenes de e; y e», las tablas 
indican cómo una transformación afecta a un cuadrado unitario (figura 2). 

Es posible construir otras transformaciones diferentes a partir de las listadas en las ta- 
blas 1 a 4; basta aplicar una transformación tras otra. Por ejemplo, un trasquilado horizontal 
podría ir seguido de una reflexión en el eje x2. La sección 2.1 mostrará que tal composición 
de transformaciones lineales es lineal. (También, véase el ejercicio 34). 


Preguntas de existencia y unicidad 


El concepto de transformación lineal ofrece una nueva manera de entender las preguntas de 
existencia y unicidad que se plantearon antes. Las dos definiciones que aparecen después 
de las tablas 1 a 4 aportan una terminología adecuada para las transformaciones. 


TABLA 1 Reflexiones 


Transformación 


1.9 Matriz de una transformación lineal 73 


Imagen del cuadrado unitario 


Matriz estándar 





Reflexión a través del eje xı 


Reflexión a través del eje x2 


Reflexión a través de la recta x2 = x1 


Reflexión a través de la recta x2 = —x1 


Reflexión a través del origen 








X 


X 


X 


Lo 1] 


[a o) 


Lo) 
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TABLA 2 Contracciones y expansiones 
































Transformación Imagen del cuadrado unitario Matriz estándar 
Contracción o X3 k 0 
y expansión 0 1 
horizontal 0 0 
1 1 
A ~i 
k k 
0 0 
0<k<1 k>1 
Contracción X Xz 1 0 
y expansión | k 
vertical H 
k 
0 
“| 
X Xi 
ma | p 
0 0 
0O<k<l k>1 
TABLA 3  Trasquilados 
Transformación Imagen del cuadrado unitario Matriz estándar 
Trasquilado X3 x2 1 k 
horizontal K 0 1 
k 1 
i 
£ 
l 1 
y Xi X1 
k lo k a) 
0 0 
k<0 k>0 
Trasquilado x, X 1 0 
vertical k 1 











TABLA 4 Proyecciones 
Transformación 


Proyección sobre 
el eje xı 


Proyección sobre 
el eje x2 
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Imagen del cuadrado unitario 


x, 1 
0 





Matriz estándar 


o] 


DEFINICION Se dice que un mapeo T : R” —> R” es sobre R” si cada b en R” es la imagen de al 
menos una x en R”. 
De manera equivalente, T es sobre R” cuando todo el rango de T es codominio R”. 
Es decir, T mapea R” sobre R” si, para cada b en el codominio R”, existe al menos una 
solución de T(x) = b. “¿T mapea R” sobre R”?” es una pregunta de existencia. El mapeo T 
no es sobre cuando existe alguna b en R” para la cual la ecuación T(x) = b no tiene solución. 
Véase la figura 3. 
j? T ¡ni0 T R 
p° p o” Me, 
i / Nn, 
f f 
T no es sobre R” T es sobre R” 
FIGURA 3 ¿El rango de T es todo [R”? 
DEFINICION Se dice que un mapeo T : R” > R” es uno a uno si cada b en R” es la imagen de 


a lo sumo una x en R”. 
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De manera equivalente, T es uno a uno si, para cada b en R”, la ecuación T(x) = b 
tiene una única solución o ninguna solución. “¿T es uno a uno?” es una pregunta de unicidad. 
El mapeo T no es uno a uno cuando algún b en R” es la imagen de más de un vector en R”. 
Si no existe tal b, entonces T es uno a uno. Véase la figura 4. 





„j0 „j0 T 
p j” 
p . pe 
po po 
. > e . 
0e 0o 
e. e 
e f 
T no es uno a uno T es uno a uno 


FIGURA 4 ¿Cada b es la imagen de a lo sumo un vector? 


Las transformaciones de proyección que se ilustran en la tabla 4 no son uno a uno y 
no mapean R? sobre R?. Las transformaciones en las tablas 1, 2 y 3 son uno a uno y sí mapean 
R? sobre R?. Otras posibilidades se muestran en los dos ejemplos siguientes. 

El ejemplo 4 y los teoremas que siguen muestran cómo las propiedades funcionales de 
ser un mapeo sobre y uno a uno están relacionadas con importantes conceptos estudiados 
antes en este capítulo. 


EJEMPLO 4 Sea T la transformación lineal cuya matriz estándar es 


1-4 8 1 
A=.|.0: “2=l 3 
0 0 0 5 


¿T mapea R4 sobre [R3? ¿T es un mapeo uno a uno? 


SOLUCIÓN Como A está en forma escalonada, podemos ver a la vez que A tiene una posi- 
ción pivote en cada fila. De acuerdo con el teorema 4 de la sección 1.4, para cada b en R?, la 
ecuación Ax = b es consistente. En otras palabras, la transformación lineal T mapea R? (su 
dominio) sobre R?. Sin embargo, ya que la ecuación Ax = b tiene una variable libre (porque 
hay cuatro variables y solamente tres variables básicas), cada b es la imagen de más de una x. 
Es decir, T no es uno a uno. E 


TEOREMA 11 Sea T : R” — R” una transformación lineal. Entonces T es uno a uno si y solo si la 
ecuación T(x) = 0 tiene únicamente la solución trivial. 


DEMOSTRACIÓN Como T es lineal, 7(0) = 0. Si T es uno a uno, entonces la ecuación 
T(x) = 0 tiene a lo sumo una solución y, por lo tanto, solo la solución trivial. Si T no es uno 
a uno, entonces existe una b que es la imagen de al menos dos diferentes vectores en R”, por 
ejemplo, u y v. Es decir, T(u) = b y T(v) = b. Pero, como T es lineal, 


Tu-—v=T0)-Tv)=b-b=0 





El vector u — v no es cero porque u + v. En consecuencia, la ecuación T(x) = 0 tiene más 
de una solución. Así, las dos condiciones del teorema son ambas verdaderas o ambas son 
falsas. E 


TEOREMA 12 






a, 
aj 





Gen(a;» a2} 


La transformación T no es 
sobre R3. 
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Sea T : R” —> R” una transformación lineal y sea A su matriz estándar. 
De esta forma, 


a) T mapea R” sobre R” si y solo si las columnas de A generan a R”; 


b) T es uno a uno si y solo si las columnas de A son linealmente independientes. 


DEMOSTRACIÓN 


a) De acuerdo con el teorema 4 de la sección 1.4, las columnas de A generan a R” si y solo 
si para cada b en R” la ecuación Ax = b es consistente; en otras palabras, si y solo si para 
cada b, la ecuación T(x) = b tiene al menos una solución. Esto es cierto si y solo si T 
mapea R” sobre R”. 


b) Las ecuaciones T(x) = 0 y Ax = 0 son iguales excepto por la notación. Así, de acuerdo 
con el teorema 11, T es uno a uno si y solo si Ax = 0 tiene únicamente la solución trivial. 
Esto ocurre si y solo si las columnas de A son linealmente independientes, como ya se 
indicó en el enunciado (3) del recuadro en la sección 1.7. E 


El enunciado a) del teorema 12 es equivalente al enunciado “T mapea R” sobre R” si y 
solo si cada vector en R” es una combinación lineal de las columnas de A”. Véase el teorema 
4 de la sección 1.4 

En el siguiente ejemplo y en algunos ejercicios posteriores, los vectores columna están 
escritos en filas, como xX = (x1, x2), mientras que T(x) se escribe como T(x1, x2) en vez de em- 
plear la manera más formal T((x1, x2)). 


EJEMPLO 5 Sea T(x, x2) = (8x1 + x2, 5x1 + 7X2, x1 + 3x2). Demuestre que T es una 
transformación lineal uno a uno. ¿T mapea R? sobre R3? 


SOLUCIÓN Cuando x y T(x) se escriben como vectores columna, es posible determinar 
por inspección la matriz estándar de T, visualizando el cálculo fila-vector de cada entrada 
en Ax. 


3IX1H+H Xx ? ? a 3 1 x 
TŒ = | 51 +7x2 |=|? ? [= 5 7 [x] (4) 
x1 + 3x2 ? ? 3 


Así, T es claramente una transformación lineal; su matriz estándar A se muestra en (4). 
Las columnas de A son linealmente independientes porque no son múltiplos entre sí. De 
acuerdo con el teorema 12b), T es uno a uno. Para determinar si T es sobre RÌ, examine el 
espacio generado por las columnas de A. Como A es de 3 x 2, las columnas de A generan a 
R? si y solo si A tiene 3 posiciones pivote, de acuerdo con el teorema 4. Esto es imposible, 
ya que A solo tiene 2 columnas. Así, las columnas de A no generan a R?, y la transformación 
lineal asociada no es sobre R?. E 


PROBLEMA DE PRÁCTICA 


Sea T : R? > R? la transformación que primero efectúa un trasquilado horizontal que 
mapea e, en e, — .5e, (pero deja inalterado a e;), y después refleja el resultado a través del 
eje x2. Suponiendo que T' es lineal, encuentre su matriz estándar. [Sugerencia: Determine la 
ubicación final de las imágenes de e4 y e2]. 
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1.9 EJERCICIOS 


En los ejercicios 1 a 10, suponga que T es una transformación lineal. 
Encuentre la matriz estándar de T. 


1. 


10. 


11. 


12. 


13. 


14. 





T : R? —> R4, T(e1) = (3, 1, 3, 1) y T(e2) = (—5, 2, 0, 0), donde 
e: = (1, 0) y ez = (0, 1). 


T: R? > R?, T(e1) = (1, 4, T(e2) = (—2, 9) y T(e3) = (3, —8), 
donde e;, ez y ez son las columnas de la matriz identidad de 
3x3. 

















T : R? > RR? es una transformación de trasquilado vertical que 
mapea e, en e, — 3e», pero deja inalterado a e». 


T : R? > R? es una transformación de trasquilado horizontal 
que no altera a e; y mapea e) en e, + 2e,. 





T : R? — R? hace girar a los puntos (en torno al origen) a través 
de un ángulo de 7/2 radianes (en sentido antihorario). 














T : R? > [R? hace girar a los puntos (en torno al origen) a través 
de un ángulo de —377/2 radianes (en el sentido horario). 





T : R? — R? primero hace girar puntos a través de —317/4 ra- 
dianes (en el sentido horario) y después los refleja a 
través del eje horizontal xı. [Sugerencia: Considere que 


T (e1) = (=1/V2, 1/42). 


T : R? > R? primero realiza una transformación de trasquilado 
horizontal que transforma a ez en e2 + 2e; (dejando inalterado a 
e1) y después refleja los puntos a través de la recta x2 = —x1. 


T: R? > R? primero refleja los puntos a través del eje horizontal 
x1 y luego los hace girar —11/2 radianes. 





T : R? > R? primero refleja los puntos a través del eje horizon- 
tal xı y luego los refleja a través de la recta x2 = xı. 


Una transformación lineal T : R? — R? primero refleja los pun- 
tos a través del eje xı y luego los refleja a través del eje x2. 
Demuestre que T también se puede describir como una transfor- 
mación lineal que hace girar los puntos en torno al origen. ¿Cuál 
es el ángulo de esa rotación? 


Demuestre que la transformación del ejercicio 10 es meramente 
una rotación en torno al origen. ¿Cuál es el ángulo de rotación? 


Sea T : R? —> R? la transformación lineal tal que T(e1) y T(e2) 
son los vectores que se muestran en la figura. Con base en la 
figura, dibuje el vector T(2, 1). 


Te) Te) 





| $ 


Sea T : R? > R? una transformación lineal con matriz estándar 
A = [a¡ a], donde a; y a, se muestran en la figura, en la parte 
superior de la columna 2. Utilizando la figura, dibuje la imagen 


de | 3] bajo la transformación T. 


X2 
a 


X1 
az 


En los ejercicios 15 y 16, llene las entradas faltantes de la matriz, 
suponiendo que la ecuación es válida para todos los valores de las 
variables. 


2 ? ? Xi 2x1 a 4x2 
15. ? ? ? X2 = X1 — X3 
2 2 2 X3 =x: + 3x3 
2 ? E 3x1 == 2x2 
16. |? ? | Ja x1 + 4x 
2 9112 


X2 


En los ejercicios 17 a 20, demuestre que T es una transformación li- 
neal encontrando una matriz que implemente el mapeo. Observe que 
X1, X2,... ho son vectores, sino entradas en vectores. 


17. T(x1, X2, X3, X4) = (x1 + 2x2, 0, 2x2 + x4, X2 — x4) 

18. T(x, X2) = (x1 + 4x2, 0, x1 — 3x2, x1) 

19. T(x, x2, x3) = (x1 — 5x2 + 4x3, x2 — 6x3) 

20. T(x, X2, X3, x4) = 3x1 + 4x3 — 2x4 (Observe que: T : Rt —> R) 


21. Sea T : R? > R? una transformación lineal tal que T(x1, x2) = 
(x1 + x2, 4x1 + 5x2). Encuentre x tal que T(x) = (3, 8). 


22. Sea T : R? — R? una transformación lineal con T(x;, x2) = 
(2x1 — x2 3x1 + xo 2x1 — 3x2). Encuentre x tal que 
T(x) = (0, —1, -4). 


En los ejercicios 23 y 24, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


23. a) Una transformación lineal 7: R" > R” está completamente 
determinada por sus efectos sobre las columnas de la matriz 
identidad de n x n. 


b) Si T : R?— RR? hace girar los vectores un ángulo ¢ en torno 
al origen, entonces T es una transformación lineal. 


c) Cuando dos transformaciones lineales se realizan una tras 
otra, el efecto combinado no siempre es una transformación 
lineal. 


d) Un mapeo T': R" > [R” es sobre [R” si cada vector x en [R” 
se mapea sobre algún vector en [R”. 


e) Si A es una matriz de 3 x 2, entonces la transformación 
x > Ax no puede ser uno a uno. 


24. a) Si A es una matriz de 4 x 3, entonces la transformación 
x > Ax mapea R? sobre R4. 


b) Cada transformación lineal de R” a R” es una transforma- 
ción matricial. 

c) Las columnas de la matriz estándar para una transformación 
lineal de R” a R” son las imágenes de las columnas de la 
matriz identidad de n x n bajo T. 





d) Un mapeo T : R” —> R” es uno a uno si cada vector en R” 
se mapea sobre un único vector en R”. 


e) La matriz estándar de una transformación de trasquilado 
; ; 0 
horizontal de R? a R? tiene la forma | a d | donde a y b 
son +1. 


En los ejercicios 25 a 28, determine si la transformación lineal espe- 
cificada es a) uno a uno o b) sobre. Justifique cada respuesta. 


25. La transformación en el ejercicio 17. 
26. La transformación en el ejercicio 2. 
27. La transformación en el ejercicio 19. 


28. La transformación en el ejercicio 14. 


En los ejercicios 29 y 30, describa las posibles formas escalonadas 
de la matriz estándar para una transformación lineal T. Utilice la no- 
tación del ejemplo 1 de la sección 1.2 


29. T:R3>R*es uno a uno. 30. T: R*>R es sobre. 


31. Sea T : R” > R” una transformación lineal, y sea A su matriz 
estándar. Complete el siguiente enunciado para hacerlo verda- 
dero: “T es uno a uno si y solo si A tiene columnas pivo- 
te”. Explique por qué el enunciado es verdadero. [Sugerencia: 
Consulte los ejercicios de la sección 1.7]. 


32. Sea T: R” > [R” una transformación lineal, y sea A su matriz 
estándar. Complete el siguiente enunciado para hacerlo verda- 
dero: “T mapea R” sobre R” si y solo si A tiene co- 
lumnas pivote”. Encuentre algunos teoremas que expliquen por 
qué el enunciado es verdadero. 
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33. Verifique la unicidad de A en el teorema 10. Sea T : R” > R” 
una transformación lineal tal que 7(x) = Bx para alguna matriz 
B de m x n. Demuestre que si A es la matriz estándar de T, 
entonces A = B. [Sugerencia: Demuestre que A y B tienen las 
mismas columnas]. 


34. Sean S : RP”. => R” y T : R” — R” transformaciones lineales. 
Demuestre que el mapeo x > T(S(x)) es una transformación 
lineal (de R? a RR”). [Sugerencia: Calcule T(S(cu + dv)) para 
u, v en R y escalares c y d. Justifique cada paso del cálculo, 
y explique por qué este proceso conduce a la conclusión 
deseada]. 


35. Si una transformación lineal T : R” —> R” mapea R” sobre 
R”, ¿es posible encontrar una relación entre m y n? Si T es uno 
a uno, ¿qué se puede decir acerca de m y n? 


36. ¿Por qué la pregunta “¿La transformación lineal T es sobre?” 
es una pregunta de existencia? 


[M] En los ejercicios 37 a 40, sea T la transformación lineal cuya 
matriz estándar se presenta. En los ejercicios 37 y 38, determine si 
T es un mapeo uno a uno. En los ejercicios 39 y 40, determine si T 
mapea Rî sobre R5. Justifique sus respuestas. 


-5 6 -5 -6 7 5 9-9 
8 3-3 8 5 6 4-4 
E B ae 
-3 2 7-2 -6 —6 6 5 
4-7 3 7 5 
6-8 5 12 -8 
39. | -7 10 -8 -9 14| 
3-5 4 2-6 
-5 6 -6 -7 3 
9.43 5 6-1 
14 15 -7 -5 4 
40. | -8 -6 12 -=5 A] 


13 14 15 3 11 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 





Observe lo que ocurre a e; y e. Véase la figura 5. Primero, e, no sufre alteraciones por el 
trasquilado y después se refleja en —e¡. Así, T(e¡) = —e¡. Segundo, e, va a ez — .Se; por 





Transformación de trasquilado 


Reflexión a través del eje x, 


FIGURA 5 Composición de dos transformaciones. 
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la transformación de trasquilado. Como la reflexión a través del eje x2 cambia a e; en —e; 
y deja inalterado a e», el vector ez — .5e; va a e, + .Se¡. Así, T(e,) = ez + .5ej. Por lo tanto, 
la matriz estándar de T es 


[ T(er) T(e,) ] = [ er e) + Se | = i d 


1.10| MODELOS LINEALES EN LOS NEGOCIOS, CIENCIA E INGENIERÍA 


En esta sección todos los modelos matemáticos son lineales; es decir, cada uno de ellos des- 
cribe un problema mediante una ecuación lineal, por lo general en forma vectorial o matricial. 
El primer modelo concierne al campo de la nutrición, pero en realidad es representativo de 
una técnica general en problemas de programación lineal. El segundo modelo pertenece al 
campo de la ingeniería eléctrica. El tercer modelo introduce el concepto de una ecuación 
lineal en diferencias, una poderosa herramienta matemática para estudiar procesos dinámicos 
en una amplia variedad de campos, como ingeniería, ecología, economía, telecomunicacio- 
nes y ciencias administrativas. Los modelos lineales son importantes porque los fenómenos 
naturales con frecuencia son lineales o casi lineales cuando las variables implicadas se man- 
tienen dentro de límites razonables. Además, los modelos lineales se adaptan más fácilmente 
al cálculo computacional que los complejos modelos no lineales. 

Conforme estudie cada modelo, preste atención en cómo su linealidad refleja alguna 
propiedad del sistema que se modela. 


Elaboración de una dieta nutritiva para bajar de peso 


La fórmula para la dieta Cambridge, una conocida dieta de la década de 1980, se basó en años 
de investigación. Un equipo de científicos, encabezados por el doctor Alan H. Howard, desa- 
rrollaron esta dieta en la Universidad de Cambridge después de más de ocho años de trabajo 
clínico con pacientes obesos.! La fórmula de la dieta baja en calorías combina un balance 
preciso de carbohidratos, proteínas de alta calidad y grasa, junto con vitaminas, minerales, 
oligoelementos y electrolitos. Millones de personas han seguido la dieta para lograr una rápi- 
da y sustancial pérdida de peso. 

Para alcanzar las cantidades y proporciones deseadas de nutrientes, Howard tuvo que 
incorporar una gran variedad de alimentos en la dieta. Cada alimento suministraba varios 
de los ingredientes requeridos, pero no en las proporciones correctas. Por ejemplo, la le- 
che sin grasa (descremada) fue la principal fuente de proteína, pero contenía mucho calcio. 
De manera que se utilizó harina de soya para aportar proteína porque contiene poco cal- 
cio. Sin embargo, proporcionalmente la harina de soya contiene mucha grasa, así que se 
adicionó suero de leche porque contiene menos grasa en relación con el calcio. Por desgracia, 
el suero de leche contiene muchos carbohidratos... 

El siguiente ejemplo ilustra el problema a pequeña escala. En la tabla 1 se listan tres 
de los ingredientes en la dieta, junto con las cantidades de ciertos nutrientes aportados por 
100 gramos (g) de cada ingrediente.? 


EJEMPLO 1 Sies posible, encuentre alguna combinación de leche descremada, harina 
de soya y suero de leche que aporte las cantidades exactas de proteínas, grasas y carbohidratos 
suministrados por la dieta diaria (tabla 1). 


1 E] primer anuncio de este rápido régimen para bajar de peso se publicó en el International Journal of Obesity 
(1978) 2, 321-332. 

2 Ingredientes en la dieta desde 1984; datos de nutrientes en ingredientes adaptados del USDA Agricultural 
Handbooks, núms. 8-1 y 8-6, 1976. 
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TABLA 1 

Cantidades (en g) suministradas por 100 g de ingrediente Cantidades (en g) 
Leche Harina Suero suministradas por la dieta 

Nutriente descremada de soya de leche Cambridge en un día 

Proteínas 36 51 13 33 

Carbohidratos 52 34 74 45 

Grasa 0 7 1.1 3 





SOLUCIÓN Dejemos que xı, x2 y x3, respectivamente, denoten el número de unidades (100 
g) de esos alimentos. Un enfoque al problema consiste en deducir ecuaciones por separado 
para cada nutriente. Por ejemplo, el producto 


xı unidades de | [proteínas por unidad 
leche descremada de leche descremada 


da la cantidad de proteína suministrada por xı unidades de leche descremada. A esta cantidad, 
le agregaríamos productos similares de harina de soya y suero de leche, igualando la suma 
resultante con la cantidad de proteína que se requiere. Se tendrían que realizar cálculos simi- 
lares para cada nutriente. 

Un método más eficiente, y más sencillo conceptualmente, consiste en considerar un 
“vector nutriente” para cada alimento y elaborar solo una ecuación vectorial. La cantidad de 
nutrientes aportados por xı unidades de leche descremada es el múltiplo escalar 


Escalar Vector 
xı unidades de nutrientes por unidad | 
leche descremada de leche descremada [— “M1 


(1) 


donde a, es la primera columna de la tabla 1. Sean a, y az los vectores correspondientes para 
harina de soya y suero de leche, respectivamente, y sea b el vector que lista el total de nutrien- 
tes requerido (la última columna de la tabla). Luego, x2a2 y x3a3 dan los nutrientes suminis- 
trados por x2 unidades de harina de soya y x3 unidades de suero de leche, respectivamente. 
De esta forma, la ecuación relevante es 


xa; + xX2a2 + x383 = b 2) 


La reducción por filas de la matriz aumentada del sistema de ecuaciones correspondiente 
indica que 


36 51 B 33 1.0. 0.277 
52 34 7 45|="-«=0 1 0.39 
0 7 11 3 0 0 1. .233 


A tres dígitos significativos, la dieta requiere .277 unidades de leche descremada, .392 uni- 
dades de harina de soya y .233 unidades de suero de leche, con el objetivo de aportar las 
cantidades deseadas de proteínas, carbohidratos y grasa. E 


Es importante que los valores encontrados para xı, x2 y x3 no sean negativos. Esto es 
necesario para que la solución sea físicamente realizable. (Por ejemplo, ¿cómo se podrían 
emplear —.233 unidades de suero de leche?) Para un gran número de requerimientos nutri- 
cionales, será necesario utilizar un mayor número de alimentos para así generar un sistema 
de ecuaciones con una solución “no negativa”. Por consiguiente, se necesitaría examinar 
muchísimas combinaciones diferentes de alimentos para encontrar un sistema de ecuaciones 
con tal solución. De hecho, el diseñador de la dieta Cambridge fue capaz de proporcionar 31 
nutrientes en cantidades precisas empleando solo 33 ingredientes. 

El problema de la elaboración de la dieta conduce al sistema lineal (2) porque la cantidad 
de nutrientes aportada por cada alimento se puede escribir como un múltiplo escalar de un vec- 
tor, como en (1). Es decir, los nutrientes suministrados por un alimento son proporcionales a la 
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cantidad del alimento agregado a la mezcla de la dieta. Además, cada nutriente en la mezcla es 
la suma de las cantidades de los diversos alimentos. 

Los problemas de formulación de dietas especializadas para humanos y ganado ocurren 
con frecuencia. Por lo regular, dichos problemas se tratan mediante técnicas de programación 
lineal. Nuestro método de construir ecuaciones vectoriales a menudo simplifica la tarea de 
formular tales problemas. 


Ecuaciones lineales y redes eléctricas 


El flujo de corriente en una red eléctrica sencilla se puede describir por un sistema de ecua- 
ciones lineales. Una fuente de voltaje, como una batería, genera una corriente de electrones 
que fluye a través de la red. Cuando la corriente pasa por un resistor (ya sea una bombilla o un 
motor), parte del voltaje se “consume”; de acuerdo con la ley de Ohm, esta “caída de voltaje” 
en el resistor está dada por 
V=RI 

donde el voltaje V se mide en volts, la resistencia R en ohms (denotados con el símbolo 0), 
y el flujo de corriente / en amperes (A). 

La red de la figura 1 contiene tres circuitos cerrados. Las corrientes que fluyen en los 
circuitos 1, 2 y 3 se denotan con J, h e h, respectivamente. Las direcciones asignadas a 
las corrientes de circuito son arbitrarias. Si una corriente resulta negativa, entonces la di- 
rección real del flujo de corriente es opuesta a la que se indica en la figura. Si la dirección 
de corriente que se muestra se aleja del lado positivo de una batería (J+), alrededor del lado 
negativo, entonces el voltaje es positivo; de otra forma, el voltaje es negativo. 

El flujo de corriente en un circuito está regido por la siguiente ley. 


LEY DE KIRCHHOFF SOBRE EL VOLTAJE 


La suma algebraica de las caídas de voltaje RI en una dirección alrededor de un circuito 
es igual a la suma algebraica de las fuentes de voltaje en la misma dirección alrededor 
del circuito. 


EJEMPLO 2 Determine las corrientes de circuito en la red de la figura 1. 


SOLUCIÓN Para el circuito 1 la corriente 7J; fluye a través de tres resistores, y la suma de 
las caídas de voltaje RI es 


4l + 4h + 31, a (4 +4+ 3) pec 114 


La corriente en el circuito 2 también fluye en parte del circuito 1, por la pequeña rama entre 
A y B. Ahí la caída RI asociada es 31) volts. Sin embargo, la dirección de corriente para la 
rama AB en el circuito 1 es opuesta a la elegida para el flujo en el circuito 2, de manera que 
la suma algebraica de todas las caídas RI para el circuito 1 es 11/, — 31). Como el voltaje en 
el circuito 1 es +30 volts, la ley de voltaje de Kirchhoff implica que 


117, —- 3b = 30 
La ecuación para el circuito 2 es 
31; + 6h = b =5 


El término —31, viene del flujo de la corriente del circuito 1 por la rama AB (con una caí- 
da de voltaje negativa porque ahí el flujo de corriente es opuesto al flujo en el circuito 2). 
El término 6/; es la suma de todas las resistencias en el circuito 2, multiplicada por la corrien- 
te del circuito. El término —/¿ = —1 * E proviene de la corriente del circuito 3 que fluye por 
el resistor de 1 ohm en la rama CD, en la dirección opuesta al flujo en el circuito 2. La ecua- 
ción para el circuito 3 es 


-h F 35 = —25 
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Observe que la batería de 5 volts en la rama CD se cuenta como parte de los circuitos 2 y 3, 
pero se considera de —5 volts para el circuito 3 debido a la dirección elegida para la corriente 
en el circuito 3. La batería de 20 volts es negativa por la misma razón. 

Las corrientes de circuito se encuentran resolviendo el sistema 


1111 -3b = 30 
31 +6b-= h= 5 (3) 

= b+3B=-25 
Las operaciones de fila sobre la matriz aumentada conducen a la solución: J = 3 A, 
h=1Aeh = —8 A. El valor negativo de 3 indica que la corriente real en el circuito 3 
fluye en la dirección opuesta a la que se muestra en la figura 1. E 


Es conveniente observar el sistema (3) como una ecuación vectorial: 


11 —3 0 30 
alas eran al 5 (4) 
0 -1 3 —25 
1 t 1 1 
rı r3 r3 M 


La primera entrada de cada vector concierne al primer circuito, y de manera similar para la 
segunda y tercera entradas. El primer vector resistor r; lista la resistencia en los diversos 
circuitos por donde fluye la corriente 74. Una resistencia se registra como negativa cuando 74 
fluye contra la dirección de flujo en otro circuito. Examine la figura 1 y vea cómo calcular 
las entradas en r1; luego, haga lo mismo con r? y r3. La forma matricial de la ecuación (4), 


Ri = v, donde, R= |r; r2 r3] e i= h 


da una versión matricial de la ley de Ohm. Si todas las corrientes de circuito se seleccionan 
en la misma dirección (por ejemplo, en sentido antihorario), entonces todas las entradas fuera 
de la diagonal principal de R serán negativas. 

De una mirada, la ecuación matricial Ri = v permite distinguir fácilmente la linealidad 
de este modelo. Por ejemplo, si se duplica el vector voltaje, entonces lo mismo ocurre con el 
vector corriente. Además, es válido el principio de superposición. Es decir, la solución de la 
ecuación (4) es la suma de las soluciones de las ecuaciones 


30 0 0 
Ri=| 0|, Ri=|5| y Ri=| 0 
0 0 -25 


Cada ecuación aquí corresponde al circuito con una sola fuente de voltaje (las otras fuentes 
se remplazan con los alambres que cierran cada circuito). El modelo para el flujo de co- 
rriente es lineal porque precisamente las leyes de Ohm y de Kirchhoff son lineales. La caída 
de voltaje en un resistor es proporcional a la corriente que fluye por él (Ohm), y la suma de 
las caídas de voltaje en un circuito iguala a la suma de las fuentes de voltaje en el circuito 
(Kirchhoff). 

Las corrientes de circuito en una red se pueden emplear para determinar la corriente 
en cualquier rama de la red. Si solo una corriente de circuito pasa por una rama, como de B 
a D en la figura 1, la corriente de la rama es igual a la corriente de circuito. Si más de una 
corriente de circuito pasan por una rama, como de A a B, la corriente de rama es la suma 
algebraica de las corrientes de circuito en la rama (ley de Kirchhoff sobre la corriente). Por 
ejemplo, la corriente en la rama AB es J; — h = 3 — 1 = 2 A, en la dirección de J4. La corrien- 
te en la rama CD es h — h = 9 A. 
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Ecuaciones en diferencias 


En muchos campos, como ecología, economía e ingeniería, surge la necesidad de modelar 
matemáticamente un sistema dinámico que cambia en el tiempo. Diversos aspectos del siste- 
ma se miden en intervalos de tiempo discretos, produciendo así una secuencia de vectores Xo, 
X1, X>,... Las entradas en x; brindan información sobre el estado del sistema en el momento 
de la k-ésima medición. 

Si existe una matriz A tal que xı = AXo, X2 = AX; y, en general, 


Xp+1 = AX; para k=0,1,2,... (5) 


entonces (5) se llama ecuación lineal en diferencias (o relación de recurrencia). Con esta 
ecuación, se pueden calcular x;, x>, y así sucesivamente, si Xy se conoce. Las secciones 4.8 
y 4.9, así como algunas otras del capítulo 5, desarrollarán fórmulas para xy y describirán 
qué ocurre a xx conforme k se incrementa indefinidamente. El análisis que se presenta a con- 
tinuación ilustra cómo puede originarse una ecuación en diferencias. 

Un tema de interés para los demógrafos es el movimiento de poblaciones o grupos de 
gente de una región a otra. El modelo sencillo que se incluye aquí considera los cambios en la 
población de una cierta ciudad y sus suburbios durante un periodo de años. 

Fije un año inicial —por ejemplo, 2000— y denote las poblaciones de la ciudad y los 
suburbios de ese año mediante rg y so, respectivamente. Sea xy el vector de población 


E ro Población de la ciudad, 2000 
= S0 Población suburbana, 2000 


Para 2001 y los años subsiguientes, denote las poblaciones de la ciudad y de los suburbios 
mediante los vectores 


r r r 
a=| h  m=|?|  x=| 7)... 
$1 $2 $3 


Nuestro objetivo es describir matemáticamente cómo podrían estar relacionados esos vecto- 
res. 

Suponga que estudios demográficos revelan que, cada año, cerca del 5% de la población 
de la ciudad se muda a los suburbios (lo que significa que el 95% permanece en la ciudad), 
mientras que el 3% de la población suburbana cambia su residencia a la ciudad (en tanto que 
el 97% permanece en los suburbios). Véase la figura 2. 


OS 
ma 


es 


97 





FIGURA 2 Porcentaje anual de migración entre la ciudad y los suburbios. 


Después de un año, los habitantes originales de la ciudad, ro, están ahora distribuidos 
entre la ciudad y los suburbios como 


.95ro | .95 Permanecen en la ciudad (6) 
O5ro | .05 Se mudan a los suburbios 
Los habitantes de los suburbios en 2000, sp, están distribuidos un año después como 
.03 Se mudan a la ciudad m 
97 Permanecen en los suburbios 
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Los vectores en (6) y (7) explican cómo se distribuye la población en 2001.* Así, 
liz .95 q 03 | [.95  .03 || ro 
sı | L o5 | 7A 97 |7 | 05.97 || so 


XxX = Mxo (8) 


Es decir, 


donde M es la matriz de migración determinada por la siguiente tabla: 


De: 
Ciudad Suburbios A: 


.95  .03 Ciudad 
.05 .97 


Suburbios 


La ecuación (8) describe cómo cambió la población de 2000 a 2001. Si los porcentajes de 
migración permanecen constantes, entonces el cambio de 2001 a 2002 está dado por 


Xx) = MX; 
y, de manera similar, de 2002 a 2003 y en los años subsiguientes. En general, 
Xx+1 = Mx; para k=0,1,2,... (9) 


La secuencia de vectores [Xo, X1, X>,...) describe las poblaciones de la ciudad y los suburbios 
durante un periodo de años. 


EJEMPLO 3 Calcule la población de la región que se acaba de describir para los años 
2001 y 2002, considerando que la población en el año 2000 era de 600,000 habitantes en la 
ciudad y de 400,000 en los suburbios. 


z do _ | 600,000 
SOLUCION La población inicial en 2000 es Xy = Eo | Para 2001, 
u2 .95  .03 || 600,000 | _ | 582,000 
1 = | 05 .97 || 400,000 | — | 418,000 
Para 2002, 
EM .95  .03 || 582,000 | _ | 565,440 a 
2 SL [1.05 .97 || 418,000 | — | 434,560 


El modelo para el movimiento poblacional en (9) es lineal porque la correspondencia 
Xx > Xx+1 es una transformación lineal. La linealidad depende de dos hechos: el número de 
personas que eligen cambiar su residencia de una área a otra es proporcional al número 
de personas en esa área, como se muestra en (6) y (7), y el efecto acumulativo de esas elec- 
ciones se encuentra sumando el movimiento de las personas de las diferentes áreas. 


PROBLEMA DE PRÁCTICA 


Encuentre una matriz A y vectores x y b tales que el problema del ejemplo 1 signifique resol- 
ver la ecuación Ax = b. 


3 Para simplificar, se ignoran otros factores que influyen en la población, como nacimientos, muertes y movimientos 
migratorios hacia la región que comprende la ciudad y los suburbios, así como hacia fuera de ella. 
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1.10 EJERCICIOS 


1. Por lo regular, el empaque de un cereal indica el número de 
calorías y las cantidades de proteínas, carbohidratos y grasa 
contenidas en una porción del producto. A continuación se dan 
las cantidades para dos cereales comunes. Suponga que se pre- 
parará una mezcla de esos dos cereales, de manera que contenga 
exactamente 295 calorías, 9 g de proteínas, 48 g de carbohidra- 
tos y 8 g de grasa. 


a) Establezca una ecuación vectorial para este problema. In- 
cluya un enunciado que explique el significado de cada va- 
riable empleada en la ecuación. 


b) Escriba una ecuación matricial equivalente, y determine si es 
posible preparar la mezcla deseada de los dos cereales. 


Información nutricional por cada porción 








General Mills Quaker? 100% 

Nutriente Cheerios* Natural Cereal 
Calorías 110 130 
Proteínas (g) 4 3 
Carbohidratos (g) 20 18 
Grasa (g) 2 5 


2. Una porción de Shredded Wheat aporta 160 calorías, 5 g de pro- 
teína, 6 g de fibra y 1 g de grasa. Una porción de Crispix® aporta 
110 calorías, 2 g de proteína, .1 g de fibra y .4 g de grasa. 


a) Establezca una matriz B y un vector u tal que Bu dé las can- 
tidades de calorías, proteínas, fibra y grasa contenidas en una 
mezcla de tres porciones de Shredded Wheat y dos porciones 
de Crispix. 

b) [M] Suponga que se desea un cereal con más fibra que 
Crispix, pero con menos calorías que Shredded Wheat. 
¿Es posible que una mezcla de ambos cereales proporcione 
130 calorías, 3.20 g de proteína, 2.46 g de fibra y .64 g de 
grasa? Si es posible, ¿cuál es la mezcla? 


3. Después de tomar una clase sobre nutrición, una consumidora 
asidua de los productos de Annie’s®, a quien le gusta el producto 
Mac and Cheese (macarrones con queso), decide mejorar los ni- 
veles de proteína y fibra en su almuerzo favorito agregando bró- 
coli y pollo enlatado. La información nutricional de los alimentos 
mencionados en este ejercicio se indica en la siguiente tabla. 


Información nutricional por cada porción 








Nutriente Mac and Cheese Brócoli Pollo Shells 
Calorías 270 51 70 260 
Proteína (g) 10 5.4 15 9 
Fibra (g) 2 5.2 0 5 


a) [M] Si ella quiere limitar su almuerzo a 400 calorías, pero 
desea obtener 30 g de proteína y 10 g de fibra, ¿qué propor- 
ciones de Mac and Cheese, brócoli y pollo debería utilizar? 


b) [M] Ella encontró que no había mucho brócoli en las pro- 
porciones del inciso a), así que decidió cambiar del clásico 


Mac and Cheese a Annie's Whole Wheat Shells and White 
Cheddar (pasta integral y queso cheddar). ¿Qué proporcio- 
nes de cada alimento debería emplear para lograr los mismos 
objetivos que en el inciso a)? 


4. La dieta Cambridge aporta .8 g de calcio por día, además de los 
nutrientes listados en la tabla 1 del ejemplo 1. Las cantidades de 
calcio por unidad (100 g) que aportan los tres ingredientes en la 
dieta Cambridge son las siguientes: 1.26 g de leche descremada, 
.19 g de harina de soya y .8 g de suero de leche. Otro ingrediente 
en la mezcla de la dieta es proteína aislada de soya, que aporta 
los siguientes nutrientes en cada unidad: 80 g de proteínas, O g 
de carbohidratos, 3.4 g de grasa y .18 g de calcio. 


a) Establezca una ecuación matricial cuya solución determine 
las cantidades de leche descremada, harina de soya, suero de 
leche y proteína aislada de soya necesarias para suministrar 
las cantidades precisas de proteínas, carbohidratos, grasa y 
calcio en la dieta Cambridge. Indique qué representan las 
variables de la ecuación. 


b) [M] Resuelva la ecuación en a) y analice la respuesta. 
En los ejercicios 5 a 8, escriba una ecuación matricial que determine 
las corrientes del circuito. [M] Si dispone de MATLAB o de algún 


otro programa de matrices, resuelva el sistema para las corrientes del 
circuito. 


5. 





10. 


11. 
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En cierta región, cada año, cerca del 7% de la población de una 
ciudad se muda a los suburbios, y alrededor del 5% de la po- 
blación suburbana cambia su residencia a la ciudad. En 2010, 
había 800,000 residentes en la ciudad y 500,000 en los subur- 
bios. Establezca una ecuación en diferencias que describa esta 
situación, donde xy sea la población inicial en 2010. Luego, es- 
time las poblaciones en la ciudad y en los suburbios dos años 
después, es decir, en 2012. (Ignore otros factores que podrían 
influir en el tamaño de las poblaciones). 


Cada año, en cierta región, cerca del 6% de la población de una 
ciudad se muda a los suburbios, y alrededor del 4% de la pobla- 
ción suburbana se muda a la ciudad. En 2010, había 10,000,000 
de residentes en la ciudad y 800,000 en los suburbios. Esta- 
blezca una ecuación en diferencias que describa esta situación, 
donde xy sea la población inicial en 2010. Luego, estime las 
poblaciones en la ciudad y en los suburbios dos años después, 
es decir, en 2012. 


En 1994, la población de California era de 31,524,000 habitan- 
tes, y la población que vivía en Estados Unidos, pero fuera de 
California, era de 228,680,000 habitantes. Durante el año, se 
estimó que 516,100 personas se mudaron de California a otro 
lugar en Estados Unidos, mientras que 381,262 personas se mu- 
daron a California desde diversos lugares del país.* 


a) Establezca la matriz de migración para esta situación, utili- 
zando cinco lugares decimales para las tasas de migración 
entrante y saliente de California. Explique cómo obtuvo la 
matriz de migración. 


b) [M] Calcule las poblaciones proyectadas para el año 2000 en 
California y en otras partes de Estados Unidos, suponiendo 
que las tasas de migración no cambian durante el periodo 
de 6 años. (Esos cálculos no toman en cuenta nacimientos, 
muertes o la migración sustancial de personas a California 
y a otros lugares de Estados Unidos provenientes de otros 
países). 


4 Datos de migración suministrados por la Unidad de Investigación Demográ- 


fica del Departamento de Finanzas del estado de California. 
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12. 


13. 


14. 


[M] Budgetó Rent A Car en Wichita, Kansas, tiene una flotilla 
de 500 vehículos, distribuidos en tres sucursales. Un auto ren- 
tado en una sucursal puede devolverse en cualquiera de las tres. 
Las diversas fracciones de autos devueltos a las tres sucursales 
se muestran en la matriz que aparece a continuación. Suponga 
que un lunes hay 295 autos en el aeropuerto (o que se rentan 
ahí), 55 autos en la sucursal de la zona este, y 150 automóviles 
en el establecimiento de la zona oeste. ¿Cuál será la distribución 
aproximada de autos para el miércoles? 


Autos rentados en: 


Aeropuerto Este Oeste Devueltos en: 
97 .05 .10 Aeropuerto 
.00 .90 .05 Este 
.03 .05 .85 Oeste 


[M] Sean M y xy como en el ejemplo 3. 


a) Calcule los vectores poblacionales x para k = 1,..., 20. 
Analice sus hallazgos. 


b) Repita el inciso a) considerando una población inicial de 
350,000 en la ciudad y 650,000 en los suburbios. ¿Qué 
encontró? 


[M] Estudie cómo los cambios en las temperaturas de los bordes 
de una placa de acero afectan a las temperaturas en los puntos 
interiores de la placa. 


a) Comience por estimar las temperaturas T1, T2, T3, T4 en cada 
uno de los conjuntos de cuatro puntos de la placa que se 
señalan en la figura. En cada caso, el valor de Tą se aproxi- 
ma mediante el promedio de las temperaturas en los cuatro 
puntos más cercanos. Consulte los ejercicios 33 y 34 de 
la sección 1.1, donde los valores (en grados) son (20, 27.5, 
30, 22.5). ¿Cómo se relaciona esta lista de valores con 
los resultados obtenidos para los puntos en los conjuntos 
a) y by? 

b) Sin efectuar cálculos, ¿qué ocurre con las temperaturas in- 
teriores en a) cuando todas las temperaturas en los bordes 
se multiplican por 3? Compruebe su suposición. 


c) Finalmente, haga una conjetura general sobre la correspon- 
dencia de la lista de ocho temperaturas en los bordes con la 
lista de las cuatro temperaturas interiores. 


























Placa A Placa B 
20° 20° 0 0 
0° -- 2 0° 10° -- E 40° 
0° E 0° 10° ALE 40° 
20° 20° 10° 10° 
a) b) 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


36 


respuestas. (Si el enunciado es válido, cite hechos o teoremas 
pertinentes. Si es falso, explique por qué o dé un contraejem- 
plo que muestre por qué el enunciado no es verdadero en cada 
caso). 


a) Cada matriz es equivalente por filas a una única matriz en 
forma escalonada. 


b) Cualquier sistema de n ecuaciones lineales con n variables 
tiene a lo sumo n soluciones. 


c) Si un sistema de ecuaciones lineales tiene dos soluciones di- 
ferentes, debe tener un número infinito de soluciones. 


d) Si un sistema de ecuaciones lineales no tiene variables li- 
bres, entonces tiene una solución única. 


e) Si una matriz aumentada [A b] se transforma en [C d] 
mediante operaciones elementales de fila, entonces las ecua- 
ciones Ax = b y Cx = d tienen exactamente los mismos 
conjuntos solución. 


f) Siun sistema Ax = b tiene más de una solución, entonces lo 
mismo sucede con el sistema Ax = 0. 


g) Si A es una matriz de m x n y la ecuación Ax = b es con- 
sistente para alguna b, entonces las columnas de A generan 
a R”. 


h) Si una matriz aumentada [A b] se puede transformar en 
una forma escalonada mediante operaciones elementales de 
fila, entonces la ecuación Ax = b es consistente. 


i) Si las matrices A y B son equivalentes por filas, tienen la 
misma forma escalonada reducida. 


j) La ecuación Ax = 0 tiene la solución trivial si y solo si no 
hay variables libres. 


k) Si A es una matriz de m x n y la ecuación Ax = b es con- 
sistente para cada b en R”, entonces A tiene m columnas 
pivote. 


1) Si una matriz A de m x n tiene una posición pivote en cada 
fila, entonces la ecuación Ax = b tiene una solución única 
para cada b en R”. 


m) Si una matriz A de n x n tiene n posiciones pivote, enton- 
ces la forma escalonada reducida de A es la matriz identidad 
den xn. 


n) Si A y B son matrices de 3 x 3 con tres posiciones pivote 
cada una, entonces A se puede transformar en B mediante 
operaciones elementales de fila. 
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13 X1 33 
71 |, x=|x]|, b=]| 45 
1.1 X3 3 


CAPÍTULO 1 EJERCICIOS COMPLEMENTARIOS 


1. Marque cada enunciado como verdadero o falso. Justifique sus 


o) Si A es una matriz de m x n, si la ecuación Ax = b tiene al 
menos dos soluciones diferentes, y si la ecuación Ax = € 
es consistente, entonces la ecuación Ax = € tiene muchas 
soluciones. 


p) SiA y B son matrices de m x n equivalentes por filas y si las 
columnas de A generan a R”, entonces también lo hacen 
las columnas de B. 


q) Si ninguno de los vectores en el conjunto S = {v1, V2, V3} 
en R? es un múltiplo de los otros vectores, entonces S es 
linealmente independiente. 


r) Si [u, v, w) es linealmente independiente, entonces u, v y W 
no están en R?, 


s) En algunos casos, es posible que cuatro vectores generen 
5 
a R. 


t) Siu y v están en R”, entonces —u está en Gen {u, v}. 


u) Siu, v y w son vectores diferentes de cero en R?, entonces w 
es una combinación lineal de u y v. 





v) Si w es una combinación lineal de u y v en R”, entonces u 
es una combinación lineal de v y w. 


w) Supongamos que V1, V2 y V3 están en R5, vz no es múltiplo 
de v1, y V3 no es una combinación lineal de vı y v2. Por lo 
tanto, {V1, V2, V3} es linealmente independiente. 


x) Una transformación lineal es una función. 


y) Si A es una matriz de 6 x 5, la transformación lineal x > Ax 
no puede mapear R5 sobre R6. 


z) Si A es una matriz de m x n con m columnas pivote, en- 
tonces la transformación lineal x > Ax es un mapeo uno 
a uno. 


Sean a y b números reales. Describa los posibles conjuntos so- 
lución de la ecuación (lineal) ax = b. [Sugerencia: El número 
de soluciones depende de a y b]. 


Las soluciones (x, y, z) de una sola ecuación lineal 
ax+by+cz=d 


forman un plano en R? cuando a, b y c no son todos cero. Cons- 
truya conjuntos de tres ecuaciones lineales cuyas gráficas a) se 
intersecan en una sola recta, b) se intersecan en un solo punto, y 
c) no tienen puntos en común. Las siguientes figuras muestran 
gráficas características. 





Tres planos se intersecan 
en una recta 


a) 











Tres planos se intersecan 
en un punto 


b) 





y 
ES 
/ 
/ y 
A - 
” A — 
A 7 
L 
Tres planos sin Tres planos sin 
intersección intersección 
c) c') 


Suponga que la matriz coeficiente de un sistema lineal de 
tres ecuaciones con tres variables tiene una posición pivote en 
cada columna. Explique por qué el sistema tiene una solución 
única. 

Determine h y k tales que el conjunto solución del sistema: 
i. es un conjunto vacío, ii. contiene una solución única, y 
iii. contiene un número infinito de soluciones. 


a) xı + 3x =k b) 
4x1 + hx 8 6x1 + kx» 


—2x1 + hx = +I 
=2 


Considere el problema de determinar si el siguiente sistema de 
ecuaciones es consistente: 


4x1 = 2x2 + 7x3 =-5 
8x1 = 3x2 + 10x3 —3 


a) Defina vectores adecuados, y replantee el problema en tér- 
minos de combinaciones lineales. Luego, resuélvalo. 


b) Defina una matriz adecuada, y replantee el problema utili- 
zando la frase “columnas de A”. 


c) Defina una transformación lineal T adecuada empleando la 
matriz en b), y exponga el problema en términos de T. 


Considere el problema de determinar si el siguiente sistema de 
ecuaciones es consistente para toda b1, b2, b3: 


2x1 = 4x2 = 2x3 = bı 
—5X1 + xat x= bz 


7x1 = 5x2 = 3x3 = b3 


a) Defina vectores adecuados y replantee el problema en térmi- 
nos de Gen ([v;, Va, V3). Luego, resuélvalo. 


b) Defina una matriz adecuada y replantee el problema utili- 
zando la frase “columnas de A”. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 
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c) Defina una transformación lineal T adecuada utilizando la 
matriz en b), y replantee el problema en términos de T. 


Describa las posibles formas escalonadas de la matriz A. Use la 
notación del ejemplo 1 de la sección 1.2. 





a) A es una matriz de 2 x 3 cuyas columnas generan a R?. 











b) A es una matriz de 3 x 3 cuyas columnas generan a R°. 


. 5 
Escriba el vector | a como la suma de dos vectores, uno sobre 


la recta {(x, y): y = 2x} y el otro sobre la recta {(x, y): 
y = x/2}. 


Sean a, a, y b los vectores en R? que se muestran en la figura, 
y sea A = [a] a]. ¿Tiene solución la ecuación Ax = b? Si es 
así, ¿es única la solución? Explique su respuesta. 





a, 


Construya una matriz A de 2 x 3, que no esté en forma escalona- 
da, de manera que la solución de Ax = 0 sea una recta en R3. 


Construya una matriz A de 2 x 3, que no esté en forma escalo- 
nada, de manera que la solución de Ax = 0 sea un plano en R°. 


Escriba la forma escalonada reducida de una matriz A de 3 x 3 
de manera que las primeras dos columnas de A sean columnas 
pivote y 

3 0 
A|-2|=]j0 

1 0 


Determine el valor o valores de a de manera que 


1 a ; ; i 
| | i | a | dia | | sea linealmente independiente. 


En a) y b), suponga que los vectores son linealmente indepen- 
dientes. ¿Qué puede decir acerca de los números a,..., f? Justi- 
fique sus respuestas. [Sugerencia: Utilice un teorema para b)]. 


a b d 
a b d 1 z A 
a) 0 $ C 5 e b) > > 
0 0 f 0 1 f 
0 0 1 


Con base en el teorema 7 de la sección 1.7, explique por qué las 
columnas de la matriz A son linealmente independientes. 


1 0 0 0 
2 5 0.0 
A= 3 6 8 0 
4 7 9 10 


Explique por qué un conjunto {V1, V2, V3, V4} en RŠ debe ser 
linealmente independiente cuando {v1, V2, V3} es linealmente 
independiente y v4 no está en Gen {vV1, V2, V3}. 


Suponga que {v1, V2} es un conjunto linealmente independiente 
en R”. Demuestre que {v;, Vi + V2} también es linealmente in- 
dependiente. 
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19. 


20. 


21. 


22. 


23. 
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Suponga que vı, V2, V3 son distintos puntos sobre una línea 
en R$. La recta no necesita pasar por el origen. Demuestre que 
{V1, V2, V3} es linealmente dependiente. 


Sea T : R” —> R” una transformación lineal, y suponga que 
T(u) = v. Demuestre que T(—u) = —v. 
Sea T : R? —> R? una transformación lineal que refleja cada 








vector a través del plano x2 = 0. Es decir, T(x1, x2, x3) = (xı, 
—x2, x3). Encuentre la matriz estándar de T. 


Sea A una matriz de 3 x 3 con la propiedad de que la transfor- 
mación lineal x > Ax mapea [R3 sobre R3. Explique por qué la 
transformación debe ser uno a uno. 


Una rotación de Givens es una transformación lineal de R” a R” 
empleada en programas de cómputo para crear una entrada cero 
en un vector (por lo general, una columna de una matriz). La 
matriz estándar de una rotación de Givens en R? tiene la forma 


E sal a+b=1 


Encuentre a y b tales que | l gire a | J 


(4, 3) 


\ 
\ 
\ 
Y 
—x 


(5, 0) 


Una rotación de Givens en (R?. 


24. 


25. 


La siguiente ecuación describe una rotación de Givens en R?. 
Encuentre a y b. 


a 0 -—b][2 245 
0 1 0J||3|=| 3 


b 0 a 4 0 


; @ +b =1 


Un gran edificio de apartamentos se construirá empleando técni- 
cas de construcción modular. El arreglo de los apartamentos, en 
cualquier piso en particular, se selecciona a partir de tres planes 
básicos. El plan A tiene 18 apartamentos en un piso, incluyendo 
3 unidades de 3 recámaras, 7 unidades de 2 recámaras, y 8 uni- 
dades de 1 recámara. Cada piso del plan B incluye 4 unidades de 
3 recámaras, 4 unidades de 2 recámaras, y 8 unidades de 1 re- 
cámara. Cada piso del plan C tiene 5 unidades de 3 recámaras, 3 
unidades de 2 recámaras, y 9 unidades de 1 recámara. Suponga 
que el edificio tiene un total de xı pisos del plan A, x2 pisos del 
plan B, y x3 pisos del plan C. 


3 
7 
8 


a) ¿Qué interpretación puede darse al vector xy 


b) Escriba una combinación lineal formal de vectores que ex- 
prese el número total de apartamentos de una, dos y tres re- 
cámaras del edificio. 


c) [M] ¿Es posible diseñar el edificio con exactamente 66 uni- 
dades de tres recámaras, 74 unidades de dos recámaras, y 
136 unidades de una recámara? Si es así, ¿existe más de una 
forma de hacerlo? Explique su respuesta. 





Álgebra de matrices 


EJEMPLO INTRODUCTORIO 


Modelos de computadora en el 
diseño de aeronaves 


Para diseñar la siguiente generación de aeronaves comerciales 
y militares, los ingenieros de Boeing's Phantom Works usan 
el modelado tridimensional (3D) y la dinámica de fluidos 
computacional (DFC). De esta manera, estudian el flujo de 
aire alrededor de un avión virtual para responder importantes 
preguntas de diseño antes de crear los modelos físicos. 

Este método ha reducido en forma drástica los tiempos y 
costos del ciclo de diseño; y el álgebra lineal desempeña 

un papel de suma importancia en el proceso. 


La aeronave virtual comienza como un modelo matemá- 
tico “de alambre” que existe solo en la memoria de la compu- 
tadora y en las terminales de presentación gráfica. (Se muestra 
el modelo de un Boeing 777). Este modelo matemático 
organiza e influye en cada paso del diseño y la manufactura 
de la aeronave, tanto en el exterior como en el interior. 

El análisis de DFC concierne a la superficie exterior. 


Aunque tal vez el acabado exterior de la aeronave 
parezca liso, la geometría de la superficie es complicada. 
Además de alas y fuselaje, un avión tiene cabinas, estabili- 
zadores, dispositivos de sustentación, aletas y alerones. 

La forma en que el aire fluye alrededor de estas estructuras 
determina cómo se desplaza la aeronave por el cielo. Las 
ecuaciones que describen el flujo del aire son complicadas y 
deben tomar en cuenta la admisión de los motores, los gases 
expelidos y las estelas que dejan las alas de la aeronave. Para 
estudiar el flujo del aire, los ingenieros necesitan de una des- 


cripción sumamente detallada de la superficie de la aeronave. 


Una computadora crea un modelo de la superficie al su- 
perponer, primero, una malla tridimensional de “cuadros” so- 
bre el modelo de alambre original. En esta malla, los cuadros 





caen completamente dentro o completamente fuera de la aero- 
nave, o se intersecan con la superficie de esta. La computadora 
selecciona los cuadros que se intersecan con la superficie 

y los subdivide, reteniendo solo los más pequeños que aún 

se intersecan con la superficie. El proceso de subdivisión se 
repite hasta que la malla se vuelve extremadamente fina. 

Una malla típica puede incluir más de 400,000 cuadros. 


El proceso para encontrar el flujo de aire alrededor de la 
aeronave implica la solución repetida de un sistema de ecuacio- 
nes lineales Ax = b que puede implicar hasta dos millones de 
ecuaciones y variables. El vector b cambia a cada momento, con 
base en datos que provienen de la malla y de las soluciones de 
ecuaciones previas. Usando las computadoras más rápidas dis- 
ponibles comercialmente, un equipo de Phantom Works puede 
tardar desde unas cuantas horas hasta varios días para configurar 
y resolver un solo problema de flujo de aire. Después de que el 
equipo analiza la solución, podrá hacer pequeños cambios en la 
superficie de la aeronave, y comenzar de nuevo todo el proceso. 
Es posible que se necesiten miles de corridas de DFC. 


En este capítulo se presentan dos conceptos importantes 
que ayudan en la solución de los enormes sistemas de 
ecuaciones de este tipo: 


+ Matrices particionadas: Un sistema típico de ecuacio- 
nes de DFC tiene una matriz de coeficientes “dispersa” 
con la mayoría de entradas iguales a cero. El agrupar 
las variables en forma correcta conduce a una matriz 
particionada con muchos bloques de ceros. En la 
sección 2.4 se presenta este tipo de matrices y se 
describen algunas de sus aplicaciones. 
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e Factorizaciones de matrices: El sistema de 
ecuaciones es complicado, incluso cuando está 
escrito con matrices particionadas. Para simplificar 
aún más los cálculos, el programa computacional 
DFC aplicado en el Boeing utiliza lo que se conoce 
como factorización LU de la matriz de coeficientes. 
En la sección 2.5 se analiza la factorización LU y 
otras factorizaciones matriciales útiles. Más adelante, 
en varias partes de este libro, aparecen más detalles 
respecto de las factorizaciones. 


Para poder analizar una solución de un sistema de flujo 





de aire, los ingenieros tienen que visualizar el flujo de aire 
sobre la superficie de la aeronave; para ello, utilizan gráficos La moderna DFC ha revolucionado el diseño de aeronaves. 
El Boing Blended Wing Body se encuentra en diseño y entrará 


nerados por computadora, y el álgebra lineal proporciona ; ; 
generados p P y 8 prop en funcionamiento en 2020 o tal vez antes. 


las herramientas para trazarlas. El modelo de marco de 


alambre de la superficie de la aeronave se almacena como de zonas pequeñas, y hacerla girar para ver partes que 
datos en muchas matrices. Una vez que se presenta la imagen quedan ocultas en determinado ángulo. Cada una de estas 
en una pantalla de computadora, los ingenieros pueden operaciones se realiza con una multiplicación adecuada de 
modificarla a escala, hacer acercamientos y alejamientos matrices. En la sección 2.7 se explican las ideas básicas. 





Nuestra capacidad para analizar y resolver ecuaciones aumentará considerablemente al adqui- 
rir la habilidad de realizar operaciones algebraicas con matrices. Más aún, las definiciones y 
los teoremas de este capítulo ofrecen algunas herramientas básicas para manejar las múltiples 
aplicaciones del álgebra lineal que implican dos o más matrices. Para matrices cuadradas, el 
teorema de la matriz invertible de la sección 2.3 reúne la mayoría de los conceptos tratados 
anteriormente en el libro. En las secciones 2.4 y 2.5 se examinan matrices particionadas y 
factorizaciones de matrices, las cuales aparecen en la mayor parte de los usos modernos del 
álgebra lineal. En las secciones 2.6 y 2.7 se describen dos aplicaciones interesantes del álge- 
bra de matrices a la economía y a los gráficos generados por computadora. 


Si A es una matriz de m x n, es decir, una matriz con m filas y n columnas, entonces la entrada 
escalar en la ¡-ésima fila y la j-ésima columna de A se denota mediante a;; y se llama entra- 
da (i, j) de A. Véase la figura 1. Por ejemplo, la entrada (3, 2) es el número a32 en la tercera 
fila, segunda columna. Cada columna de A es una lista de m números reales, que identifica 
un vector en R”. Con frecuencia, estas columnas se denotan mediante aj,..., a,, y la matriz 
A se escribe como 


A=la4 a vu: a, 


Observe que el número a, es la ¡-ésima entrada (desde arriba) del j-ésimo vector columna a. 

Las entradas diagonales en una matriz A = [a;¡] de m x n son ayy, 42, 433,..., y for- 
man la diagonal principal de A. Una matriz diagonal es una matriz cuadrada de n x n 
cuyas entradas no diagonales son cero. Un ejemplo es la matriz identidad de n x n, I. 
Una matriz de m x n cuyas entradas son todas cero es una matriz cero o matriz nula y se es- 
cribe como 0. El tamaño de una matriz cero, por lo general, es evidente a partir del contexto. 


TEOREMA 1 
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Columna 
J 
aii Tea aij Dt ain 
Filai | ag === Dag += Gin |=A 
ami Daci amj Tan amn 
aj a; a 


j n 


FIGURA 1 Notación matricial. 


Suma y múltiplos escalares 


La aritmética para vectores que se describió anteriormente tiene una extensión natural hacia 
las matrices. Se dice que dos matrices son iguales si tienen el mismo tamaño (es decir, el 
mismo número de filas y de columnas) y si sus columnas correspondientes son iguales, lo 
que equivale a decir que sus entradas correspondientes son iguales. Si A y B son matrices de 
m x n, entonces la suma A + B es la matriz de m x n cuyas columnas son las sumas de las 
columnas correspondientes en A y B. Puesto que la suma vectorial de las columnas se realiza 
por entradas, cada entrada en A + B es la suma de las entradas correspondientes de A y B. 
La suma A + B está definida solo cuando A y B son del mismo tamaño. 


EJEMPLO 1 Sean 


4 0 5 1 1 1 53 
azla 3 J s=l; 5 A c=|; i] 


Luego, 
5 1 6 
aj ES 
pero A + C no está definida porque A y C tienen diferentes tamaños. E 


Si r es un escalar y A es una matriz, entonces el múltiplo escalar rA es la matriz cuyas 
columnas son r veces las columnas correspondientes de A. Al igual que sucede con los vecto- 
res, —A significa (—1)A, y A — B es igual que A + (—1)B. 


EJEMPLO 2 SiA yB sonlas matrices del ejemplo 1, entonces 


1 1]_ [2 2 2 
3 7|7|6 10 14 


1 
5 
4 0 5 2 2 2 2 -2 3 
a-28=| $ 3 IRE 10 a] -| =1 ja] m 
En el ejemplo 2 no fue necesario calcular A — 2B como A + (—1)2B porque las reglas 


usuales del álgebra se aplican a las sumas y los múltiplos escalares de matrices, como se verá 
en el siguiente teorema. 


28 =2| 


Sean A, B y C matrices del mismo tamaño, y sean r y s escalares. 
a A+B=B+A d) r(A + B)=rA + rB 
b) (A+B)+C=A+(B+C) e) (r + s)A = rA + sA 
Cc) A+0=A f) r(sA) = (rs)A 
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Cada igualdad del teorema 1 se comprueba al mostrar que la matriz del lado izquierdo 
tiene el mismo tamaño que la del lado derecho y que las columnas correspondientes son 
iguales. El tamaño no es problema porque A, B y C son del mismo tamaño. La igualdad de co- 
lumnas es consecuencia inmediata de las propiedades análogas de los vectores. Por ejemplo, 
si las columnas ¡-ésimas de A, B y C son aj, b; y cj, respectivamente, entonces las columnas 
j-ésimas de (A + B) + Cy de A + (B + C) son 


(a; + b;) + C y aj + (b; + cj), 


respectivamente. Ya que estas dos sumas vectoriales son iguales para cada j, la propiedad b) 
queda comprobada. 

Debido a la propiedad asociativa de la suma, se puede escribir simplemente A + B + C 
para la suma, lo cual se calcula como (A + B) + C, o bien, como A + (B + C). Lo mismo se 
aplica a sumas de cuatro o más matrices. 


Multiplicación de matrices 


Cuando una matriz B multiplica a un vector x, transforma a x en el vector Bx. Si después 
este vector se multiplica, a la vez, por una matriz A, el vector resultante es A(Bx). Véase la 
figura 2. 


Multiplicación Multiplicación 
por B por A 


e 
Bx A(Bx) 
FIGURA 2 Multiplicación por B y luego por A. 


Así, A(Bx) se produce a partir de x por una composición de mapeos, las transformaciones 
lineales estudiadas en la sección 1.8. Nuestro objetivo es representar este mapeo compuesto 
como la multiplicación por una sola matriz, que se denota con AB, de manera que 


A(Bx) = (AB)x (1) 
Véase la figura 3. 
Multiplicación Multiplicación 
por B por A 
xo ° eA(Bx 
Bx (Bx) 
Multiplicación 
por AB 


FIGURA 3 Multiplicación por AB. 


Si A es de m x n, B es de n x p y x está en RP, las columnas de B se denotan como 
b;,..., b,, y las entradas de x como x1,..., Xp. Por consiguiente, 


Bx = xıb; + = + xpb, 
Por la linealidad de la multiplicación por A, 


A(Bx) = A(x¡b,) +--- + A(xpbp) 


= x14b¡ +-::+xp4b, 
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El vector A(Bx) es una combinación lineal de los vectores Ab;,..., Ab,, usando las entradas 
de x como pesos. En notación matricial, esta combinación lineal se escribe como 
A(Bx) = [4b; Ab -*- Ab, ]x 


Así, la multiplicación por [4b, Ab» -** Ab,] transforma a x en A(Bx). ¡Ya encontramos 
la matriz buscada! 


Si A es una matriz de m x n, y si B es una matriz de n x p con columnas b;,..., b,enton- 
ces el producto AB es la matriz de m x p cuyas columnas son Ab,,..., Ab,. Es decir, 


AB = Albi bz =- b,]=[4b; Ab ++: Ab] 


Esta definición hace que la ecuación (1) sea verdadera para toda x en RP. La ecua- 
ción (1) demuestra que el mapeo compuesto de la figura 3 es una transformación lineal y que 
su matriz estándar es AB. La multiplicación de matrices corresponde a la composición de 
transformaciones lineales. 


EJEMPLO 3 Calcule AB, donde A = E apra = p 3 a 


SOLUCIÓN Escriba B = [bı b2 b3], y calcule: 


w[i SE) eG sl 5 
afa] -[,] lA] 
E 


11 0 A 


Luego, 


-1 13 -9 
a 


Ab; Ab) Ab; 


AB = Alb; b, ba)=| 


Observe que como la primera columna de AB es Ab, esta columna es una combinación 
lineal de las columnas de A usando como pesos las entradas de bı. Un enunciado similar es 
verdadero para cada columna de AB. 


Cada columna de AB es una combinación lineal de las columnas de A usando pesos de 
la columna correspondiente de B. 


Evidentemente, el número de columnas de A debe corresponder al número de filas en B 
para que una combinación lineal como Ab, esté definida. Además, la definición de AB mues- 
tra que AB tiene el mismo número de filas que A y el mismo número de columnas que B. 


EJEMPLO 4  SiA es una matriz de 3 x 5 y B una matriz de 5 x 2, ¿cuáles son los tamaños 
de AB y de BA, si tales productos están definidos? 
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SOLUCIÓN Como A tiene 5 columnas y B tiene 5 filas, el producto AB está definido y es una 
matriz de 3 x 2: 


A B AB 
Ko Ro * xk * ok 
de de en e X k|=]|x* x 
x *k ok * * * xk 
* ok 
k Ek 
3x5 Hay 5x2 3x2 


correspon- 
dencia 


Tamaño de AB 





El producto BA no está definido, porque las dos columnas de B no se corresponden con las 
tres filas de A. E 


La definición de AB es importante para el trabajo teórico y las aplicaciones, pero la 
siguiente regla ofrece un método más eficiente para calcular cada una de las entradas de AB 
cuando se resuelven a mano problemas sencillos. 


REGLA FILA-COLUMNA PARA CALCULAR AB 


Si el producto AB está definido, entonces la entrada en la fila i y la columna j de 
AB es la suma de los productos de las entradas correspondientes de la fila i de A y 
la columna ¡ de B. Si (AB); denota la entrada (i, ¡) en AB, y si A es una matriz de 
m X n, entonces 


(AB); = aibıj + anba + © + dinbnj 


Para comprobar esta regla, sea B = [bı =: bp]. La columna j de AB es Ab;, y pode- 
mos calcular Ab; usando la regla fila-vector para calcular Ax, como vimos en la sección 1.4. 
La i-ésima entrada de Ab; es la suma de los productos de entradas correspondientes de la 
fila į de A y del vector bj, que es precisamente el cálculo descrito en la regla para calcular 
la entrada (i, j) de AB. 


EJEMPLO 5 Use la regla fila-columna para calcular dos de las entradas de AB para las 
matrices del ejemplo 3. Una inspección de los números implicados aclarará cómo los dos 
métodos para calcular AB producen la misma matriz. 


SOLUCIÓN Para encontrar la entrada de la fila 1 y la columna 3 de AB, considere la fila 1 
de A y la columna 3 de B. Multiplique las entradas correspondientes y sume los resultados, 
como se muestra a continuación: 


O ES PSN 


Para la entrada en la fila 2 y la columna 2 de AB, use la fila 2 de A y la columna 2 de B: 


f 
Af mlli > JUE IOFS alel B a] 
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EJEMPLO 6 Encuentre las entradas de la segunda fila de AB, donde 


A= , B=|7 1 
6 -8 -7 a 
-3 0 9 


SOLUCIÓN De acuerdo con la regla fila-columna, las entradas de la segunda fila de AB pro- 
vienen de la fila 2 de A (y de las columnas de B): 

















e O A 
$. 
—| E || 
6 -8 -7 || 
3 0 9 
O O O 1 
| A | 5 1 
z O O =E m 
O O O 1 

















Observe que puesto que el ejemplo 6 pedía solamente la segunda fila de AB, se podría 
haber escrito solamente la segunda fila de A a la izquierda de B para calcular 


4 —6 
[-1 3 -4])7 1|=[5 1] 
3 2 


Esta observación acerca de las filas de AB es cierta en general, y es consecuencia de la regla 
fila-columna. Dejemos que fila; (A) denote la i-ésima fila de una matriz A. De esta forma, 


fila; (AB) = fila; (4) - B (2) 


Propiedades de la multiplicación de matrices 


El siguiente teorema lista las propiedades estándar de la multiplicación de matrices. Recuerde 
que /,, representa la matriz identidad de m x m, y que 1,,x = X para toda x en [R”. 


Sea A una matriz de m x n, y sean B y C matrices con tamaños para los que las sumas 
y los productos indicados están definidos. 


a) A(BC) = (AB)JC (ley asociativa de la multiplicación) 
b) A(B+ C)=AB + AC (ley distributiva izquierda) 
c) (B + OA = BA + CA (ley distributiva derecha) 


d) r(AB) = (rA)B = A(rB) 
para cualquier escalar r 


e) [A = A = Al, (identidad para la multiplicación de matrices) 


DEMOSTRACIÓN Las propiedades b) a e) se consideran en los ejercicios. La propiedad a) 
es consecuencia de que la multiplicación de matrices corresponde a la composición de trans- 
formaciones lineales (que son funciones) y se sabe (o es fácil comprobar) que la composición 
de funciones es asociativa. A continuación se presenta otra demostración de a) que se basa en 
la “definición de columna” del producto de dos matrices. Sea 


C= [c1 = ep] 
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Por la definición de multiplicación de matrices, 


BC =[Bc; - Bc] 
A(BC) =[A(Bcı) -- A(Bcp)] 


Recuerde de la ecuación (1) que la definición de AB hace que A(Bx) = (AB)x para toda x, de 
manera que 


A(BC) = [(AB)cı +- (AB)cp] = (AB)C E 


Las leyes asociativa y distributiva de los teoremas 1 y 2 expresan, en esencia, que es po- 
sible agregar o eliminar parejas de paréntesis en expresiones matriciales de la misma manera 
que sucede en el álgebra de números reales. En particular, se puede escribir el producto como 
ABC y calcularlo ya sea como A(BC) o (AB)C.! De manera similar, un producto de cuatro 
matrices ABCD se puede calcular como A(BCD) o (ABC)D o A(BO)D, y así sucesivamente. 
No importa cómo se agrupen las matrices al realizar el cálculo de un producto, siempre y 
cuando se conserve el orden de izquierda a derecha de las matrices. 

El orden de izquierda a derecha en productos es importante porque, en general, AB y 
BA, no son iguales. Esto no es sorprendente, ya que las columnas de AB son combinaciones 
lineales de las columnas de A, mientras que las columnas de BA se construyen a partir de las 
columnas de B. La posición de los factores en el producto AB se enfatiza al decir que A se 
multiplica por la derecha por B o que B se multiplica por la izquierda por A. Si AB = BA, 
se dice que A y B conmutan una con la otra. 


S-il 


EJEMPLO 7 Sea i=l; 2 


| y B= B e Muestre que estas matrices no 


conmutan. Es decir, compruebe que AB + BA. 


SOLUCIÓN 
"E 
sa=|4 3 ls > ]= [2 -2] . 
El ejemplo 7 ilustra la primera de la siguiente lista de diferencias importantes entre el 


álgebra de matrices y el álgebra de números reales. Para ver ejemplos de estas diferencias, 
consulte los ejercicios 9 a 12. 


ADVERTENCIAS: 
1. En general, AB + BA. 


2. Las leyes de la cancelación no se aplican en la multiplicación de matrices. Es decir, 
si AB = AC, en general no es cierto que B = C. (Véase el ejercicio 10). 


3. Si un producto AB es la matriz cero, en general, no se puede concluir que A = 0 
o B =0. (Véase el ejercicio 12). 


Potencias de una matriz 


Si A es una matriz de n x n y k es un entero positivo, entonces A* denota el producto de k 


1 Cuando B es cuadrada y C tiene menos columnas que las filas de A, es más eficiente calcular A(BC) en vez de 
(AB)C. 
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copias de A: 
AX = AS : A 


k 


Si A es diferente de cero y x está en RR”, entonces A*x es el resultado de multiplicar repe- 
tidamente k veces a x por la izquierda por A. Si k = 0, entonces Ax debería ser la misma 
x. Por consiguiente, A? se interpreta como la matriz identidad. Las potencias de matrices 
son útiles tanto en la teoría como en las aplicaciones (secciones 2.6, 4.9, y más adelante 
en el libro). 


La transpuesta de una matriz 


Dada una matriz A de m x n, la transpuesta de A es la matriz de n x m, que se denota con AT, 
cuyas columnas se forman a partir de las filas correspondientes de A. 


EJEMPLO 8 Sean 


3 5-2 


Por lo tanto, 


1 33 

o a C T —5 1 0 in S 1 5 

dl k ral Te Le? u 
1 7 


Sean A y B matrices cuyos tamaños son adecuados para las siguientes sumas y pro- 
ductos. 

a) (A)T =A 

b) (A + B) =A" + B7 

c) Para cualquier escalar r, (rA)? = rAT 

d) (ABY = Bla? 


Las demostraciones de a) a c) son directas y se omiten. Para d), véase el ejercicio 33. Por 
lo regular, (AB) no es igual a A7B”, aun cuando A y B tengan tamaños tales que el producto 
ATB" esté definido. 

La generalización del teorema 3d) a productos de más de dos factores puede expresarse 
con palabras de la siguiente forma: 


La transpuesta de un producto de matrices es igual al producto de sus transpuestas en 
orden inverso. 


Los ejercicios incluyen ejemplos numéricos que ilustran las propiedades de las trans- 
puestas. 
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NOTAS NUMÉRICAS 





1. La manera más rápida de obtener AB en una computadora depende de la forma en 
que la computadora guarde las matrices en su memoria. Los algoritmos estándar de 
gran eficiencia, tales como los de LAPACK, calculan AB por columnas, como en 
nuestra definición del producto. (Una versión de LAPACK escrita en C++ calcula 


AB por filas). 


La definición de AB se presta en sí misma al procesamiento paralelo en una compu- 
tadora. Las columnas de B se asignan individualmente o en grupos a diferentes 
procesadores que, de manera independiente, y por lo tanto simultánea, calculan las 
columnas correspondientes de AB. 


PROBLEMAS DE PRÁCTICA 





1. Puesto que los vectores en R” se pueden considerar como matrices de n x 1, las propie- 
dades de las transpuestas del teorema 3 también se aplican a vectores. Sean 


ara a 


Calcule (4x7, x7A?, xx" y xYx. ¿Está definida A7x7? 


2. Sean A una matriz de 4 x 4 y sea x un vector en R4. ¿Cuál es la forma más rápida de 
calcular 42x? Cuente las multiplicaciones. 


2.1 EJERCICIOS 


En los ejercicios 1 y 2, calcule cada suma o producto si la matriz 
está definida. Si alguna expresión no está definida, explique por qué. 
Sean 


2 0 =l Tsa i 
a=|; -5 a =|; —4 h 


c=[3 3} 0-2 5) [5] 


1. —2A, B — 2A, AC, CD 

2. A + 3B,2C — 3E, DB, EC 
En lo que resta de este conjunto de ejercicios y los que siguen, su- 
ponga que todas las expresiones matriciales están definidas. Es decir, 


los tamaños de las matrices y los vectores implicados “ajustan” de 
manera correcta. 


3. Sea A = ls aj | calcule 3 — A y (3DJA. 
4. Calcule A — 51 y (5L3)A, donde 
5-1 3 
A=|-4 3 -6 
3. 1 2 


En los ejercicios 5 y 6 calcule el producto AB de dos maneras: a) con 
la definición, donde Ab; y Ab, se calculan por separado, y b) por la 
regla de la fila-columna para obtener AB. 


-1 3 
5. A=| 2 slefi a) 
5 -3 


10. 


11. 


12. 


A=|-3 5 e | e] 
o 1 


Si A es una matriz de 5 x 3 y el producto AB es 5 x 7, ¿cuál es 
el tamaño de B? 


¿Cuántas filas tiene B si BC es una matriz de 5 x 4? 


2 3 1 
-1 T 


de k, si los hay, harán que AB = BA? 


Sean A = | el ¿Qué valor(es) 


3 —6 -1 1 _|-3 =5 
Sen A= | pa iela l 
Compruebe que AB = AC y, sin embargo, B + C. 

1. 2 3 5 0 0 
Sean A=|2 4 5ļyD=|0 3 OJ. Calcule 

3J- F “6 0 0 2 


AD y DA. Explique cómo cambian las columnas o filas de A 
cuando se multiplica por D por la derecha o por la izquierda. 
Encuentre una matriz B de 3 x 3, que no sea la matriz identidad 
o la matriz cero, tal que AB = BA. 


3 


Sea A = E 


—6 ; 
J Construya una matriz B de 2 x 2 tal 


que AB sea igual a la matriz cero. Utilice para B dos diferentes 
columnas no nulas (distintas de cero). 


13. Sean rj,..., r, vectores en [R”, y sea Q una matriz de m x n. 
Escriba la matriz [Or, -** Or,] como un producto de dos 
matrices (ninguna de ellas igual a la matriz identidad). 


14. Sea U la matriz de 3 x 2 de costos descrita en el ejemplo 6 
de la sección 1.8. La primera columna de U lista los costos 
por dólar de producción para elaborar el producto B, y la se- 
gunda columna lista los costos por dólar de producción para 
el artículo C. (Los costos están por categorías de materiales, 
mano de obra y gastos indirectos). Sea q, un vector en R? 
que liste la producción (medida en dólares) de los productos B 
y C manufacturados durante el primer trimestre del año, y 
sean q2, q3 y qu los vectores análogos que listan las canti- 
dades de productos B y C manufacturados en el segundo, 
tercero y cuarto trimestres, respectivamente. Dé una des- 
cripción económica de los datos en la matriz UO, donde 


O= (q. q 43 q4). 


Los ejercicios 15 y 16 tratan de matrices arbitrarias A, B y C para 
las cuales las sumas y los productos indicados están definidos. 
Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. 


15. a) SiA y B son matrices de 2 x 2 con columnas aj, a, y b;, b,, 
respectivamente, entonces AB = [a;b] azb2]. 


b) Cada columna de AB es una combinación lineal de las co- 
lumnas de B usando los pesos de la columna correspondiente 
de A. 


c) AB+ AC=A(B+C) 
d) AT+BT=(A + B)" 
e) La transpuesta de un producto de matrices es igual al pro- 
ducto de sus transpuestas en el mismo orden. 
16. a) La primera fila de AB es la primera fila de A multiplicada 
por B por la derecha. 


b) Si A y B son matrices de 3 x 3 y B = [bi 
ces AB = [Ab + Ab, + Ab3]. 


c) Si A es una matriz de n x n, entonces (4237 = (47)? 

d) (ABC)! = CTATBT 

e) La transpuesta de una suma de matrices es igual a la suma 
de sus transpuestas. 


b2 b3], enton- 


17. Si A= [E 5 1 17 


l se] y AB= DE = | determine la pri- 
mera y la segunda columnas de B. 


18. Suponga que la tercera columna de B está conformada en su 
totalidad por ceros. ¿Qué se puede decir acerca de la tercera 
columna de AB? 


19. Suponga que la tercera columna de B es la suma de las dos pri- 
meras columnas. ¿Qué se puede decir acerca de la tercera co- 
lumna de AB? ¿Por qué? 


20. Suponga que las dos primeras columnas de B, bı y b2, son 
guales. ¿Qué se puede decir acerca de las columnas de AB? 
¿Por qué? 


21. Suponga que la última columna de AB está conformada en su 
totalidad por ceros, pero B, por sí sola, no tiene columnas de 
ceros. ¿Qué se puede decir acerca de las columnas de A? 
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22. Demuestre que si las columnas de B son linealmente depen- 
dientes, entonces también lo son las columnas de AB. 


23. Suponga que CA = /,, (la matriz identidad de n x n). Demuestre 
que la ecuación Ax = (0 tiene únicamente la solución trivial. 
Explique por qué A no puede tener más columnas que filas. 


24. Suponga que A es una matriz de 3 x n cuyas columnas ge- 
neran a R3. Explique cómo construir una matriz D de n x 3 
tal que AD = h. 


25. Suponga que A es una matriz de m x n, y que existan las ma- 
trices C y D de n x m, tales que CA = I, y AD = Im. De- 
muestre que m = n y C = D. [Sugerencia: Piense en el pro- 
ducto CAD]. 


26. Suponga que AD = Im (la matriz identidad de m x m). De- 
muestre que para toda b en R”, la ecuación Ax = b tiene una 
solución. [Sugerencia: Piense en la ecuación ADb = b]. Expli- 
que por qué A no puede tener más filas que columnas. 


En los ejercicios 27 y 28, considere los vectores en R” como ma- 
trices de n x 1. Para u y v en R”, el producto de matrices uv es una 
matriz de 1 x 1, que se llama producto escalar, o producto interno, 
de u y v. Por lo general, se escribe como un único número real sin 
corchetes. El producto de matrices uv” es una matriz de n x n, que 
se llama producto exterior de u y v. Los productos uv y uv” se 
presentarán más adelante en el libro. 


=3 a 
2 |yv= | b |. Calcule uy, vu, uv” y vu”. 
=5 c 


27. Sea u = 


28. Siu y v están en R”, ¿cómo se relacionan uv y v/u? ¿Y cómo 
se relacionan uv” y vu”? 


29. Compruebe el teorema 2b) y 2c). Use la regla fila-columna. 
La entrada (i, j) de A(B + C) se puede escribir como 
ailbij + cy) ++ + ain(bnj + Crj) 


o 


de Aix (Dxj + Crj) 


k=1 


30. Compruebe el teorema 2d). [Sugerencia: La entrada (i, j) en 
(ran)bij + © + (fain)bnjl. 


31. Demuestre que „A = A, donde A es una matriz de m x n. 
Suponga que /,,x = x para toda x en R”. 


32. Demuestre que A/ = A cuando A es una matriz de m x n. 
[Sugerencia: Use la definición (de columna) de A/,,]. 


33. Demuestre el teorema 3d). [Sugerencia: Considere la j-ésima 
fila de (AB). 


34. Dé una fórmula para (ABx)”, donde x es un vector, y A y B son 
matrices con los tamaños adecuados. 


35. [M] Lea la documentación de su programa de matrices y escriba 
los comandos que producirían las siguientes matrices (sin intro- 
ducir cada entrada de la matriz). 


a) Una matriz de 4 x 5 de ceros. 
b) Una matriz de 5 x 3 de unos. 
c) La matriz identidad de 5 x 5. 


d) Una matriz diagonal de 4 x 4, con entradas diagonales 3, 
4,2,5. 
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Una forma útil de someter a prueba ideas nuevas o de hacer con- 
jeturas en álgebra de matrices es realizar cálculos con matrices se- 
leccionadas en forma aleatoria. La comprobación de una propiedad 
para unas cuantas matrices no demuestra que la propiedad sea válida 
en general, pero permite que la propiedad sea más creíble. Además, 
es posible descubrir si una propiedad es falsa realizando unos cuan- 
tos cálculos. 


36. 


37. 


38. 


[M] Escriba el comando o los comandos necesarios para crear 
una matriz de 5 x 6 con entradas aleatorias. ¿Dentro de qué 
rango de números se encuentran las entradas? Diga cómo crear 
aleatoriamente una matriz de 4 x 4 con entradas enteras en- 
tre —9 y 9. [Sugerencia: Si x es un número aleatorio tal que 
0<x<l, entonces —9.5 < 19(x — .5) < 9.5]. 


[M] Construya matrices aleatorias A y B de 4 x 4, y comprue- 
be si AB = BA. La mejor manera de hacer esto es calcular 
AB — BA y comprobar si esta diferencia es la matriz cero. Des- 
pués compruebe AB — BA para tres pares más de matrices alea- 
torias de 4 x 4. Escriba un informe de sus conclusiones. 


[M] Construya una matriz aleatoria A de 5 x 5 y compruebe 
si (A + IA — 1) = A? — I. La mejor manera de hacer esto es 
calcular (A + D(A — D — (4? — D, y verificar que esta dife- 
rencia sea la matriz cero. Realícelo para tres matrices al azar. 


39. 


40. 


41. 


Luego, someta a prueba (A + B)(A — B) = A? — B? de la misma 
forma para tres pares de matrices aleatorias de 4 x 4. Escriba un 
informe de sus conclusiones. 


[M] Use al menos tres pares de matrices aleatorias A y B de 
4 x 4 para someter a prueba las igualdades (A + B)? = AT + BT 
y (AB)! = B'AT, así como (AB) = ATB" (Véase el ejercicio 37). 
Escriba un informe de sus conclusiones. [Nota: La mayoría de 
los programas de matrices usan A” para representar A7]. 


[M] Sea 
0 1 0 0 0 
0 0 1 0 0 
s=|0 0 0 1 0 
0 0 0 0 1 
0 0 0 0 al 


Calcule S* para k = 2,..., 6. 


[M] Describa con palabras qué ocurre cuando se calcula A5, A!?, 
A2 y A30 para 

1/4 1/2 1/4 
A=]|1/⁄2 1⁄3 1/6 

1/4 1/6 7/12 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Ax= 


[> “lil 


XAT =[5 JE a = 


-4 


> | De manera que (Ax)” = [-4 2]. También, 


[-4 


2] 


Las cantidades (Ax)” y x7A” son iguales, por el teorema 3d). Después, 


X X= 


Je a- 


[5 315] = [25 + 9] = 34 


25 15 
15 9 


3 


Una matriz de 1 x 1 como xfx generalmente se escribe sin corchetes. Por último, A7x7 
no está definida, ya que x” no tiene dos filas que correspondan a las dos columnas 


de AT. 


2. La manera más rápida de calcular A?x es calculando A(Ax). El producto AX requiere 
16 multiplicaciones, 4 por cada entrada, y A(Ax) requiere 16 más. En contraste, el pro- 
ducto A? requiere 64 multiplicaciones, 4 por cada una de las 16 entradas en A?. Después 
de eso, A?x requiere 16 multiplicaciones más, para un total de 80. 


2.2 | LA INVERSA DE UNA MATRIZ 


El álgebra de matrices brinda herramientas para manejar ecuaciones matriciales y crear di- 
versas fórmulas útiles, de manera similar a lo que sucede en el álgebra con números reales. 
En esta sección se investiga el análogo matricial del recíproco, o inverso multiplicativo, de un 


número diferente de cero. 
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Recuerde que el inverso multiplicativo de un número como 5 es 1/5 o 5”!. Este inverso 
satisface la ecuación 


51.5=1 y 5:51=1 
La generalización matricial requiere ambas ecuaciones y evita la notación con diagonales 
(para división), ya que la multiplicación de matrices no es conmutativa. Además, una genera- 
lización completa solo es posible si las matrices implicadas son cuadradas. ! 
Se dice que una matriz A de n x n es invertible si existe otra matriz C de n x n tal que 
CA=I y AC=1 
donde 7 = [,, la matriz identidad de n x n. En este caso, C es una inversa de A. En efecto, 
C está determinada únicamente por A, ya que si B fuera otra inversa de A, entonces B = 
BI = B(AC) = (BA)C = IC = C. Esta inversa única se denota mediante A”, tal que, 
AA E 


Una matriz que no es invertible en ocasiones se llama matriz singular, y una matriz invertible 
se llama matriz no singular. 


e 6 el f 
a-[3 5 ilio 1 


Por lo tanto, C = A7 !. E 


EJEMPLO 1 Si 4= E A yC= E z entonces 


A continuación se presenta una fórmula sencilla para la inversa de una matriz de 2 x 2, 
junto con una prueba para saber si existe la inversa. 


Sea A = E 7 | Si ad — bc + 0, entonces A es invertible y 


d 
1 d —b 
ATI = ——— 
ad — bc E a | 
Si ad — bc = 0, entonces A no es invertible. 
La sencilla demostración del teorema 4 se esboza en los ejercicios 25 y 26. La cantidad 
ad — bc se llama determinante de A, y se escribe como 
detA = ad — bc 


El teorema 4 establece que una matriz A de 2 x 2 es invertible si y solo si det A + 0. 


l Podría decirse que una matriz A de m x n es invertible si existen matrices C y D de n x m, tales que CA = I, y 
AD = Im. Sin embargo, estas ecuaciones implican que A es cuadrada y C = D. Por lo tanto, A es invertible como 
ya se definió. Véase los ejercicios 23 a 25 en la sección 2.1. 
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TEOREMA 5 


EJEMPLO 2 Encuentre la inversa de A = E al 


SOLUCIÓN Ya que det A = 3(6) — 4(5) = —2 + 0, A es invertible, y 


sl a 


Las matrices invertibles son indispensables en álgebra lineal, sobre todo para cálculos 
algebraicos y deducciones de fórmulas, como en el teorema siguiente. En ocasiones, una 
matriz inversa permite entender mejor un modelo matemático de alguna situación de la vida 
real, como en el ejemplo 3 que se presenta un poco más adelante. 


Si A es una matriz invertible de n x n, entonces, para cada b en R”, la ecuación Ax = b 
tiene la solución única x = AT 'b. 


DEMOSTRACIÓN Tome cualquier b en R”. Existe una solución porque cuando se susti- 
tuye AT !b por x, se tiene Ax = A(A7!b) = (AA`!)b = 1b = b. Así que 47 'b es una solución. 
Para probar que la solución es única, demuestre que si u es cualquier solución, entonces u 
debe ser, de hecho, 47!b. En efecto, si Au = b, podemos multiplicar ambos miembros por 
A”! y obtener 


A`!Au = A™!b, lu=A4 'b y u=4"'b E 


EJEMPLO 3 Una viga elástica horizontal tiene soportes en cada extremo y está sujeta 
a fuerzas en los puntos 1, 2 y 3, como indica la figura 1. Sea f en R? tal que liste las fuerzas 
en estos puntos, y sea y en R? tal que liste las magnitudes de deflexión (es decir, de movi- 
miento) de la viga en los tres puntos. Con base en la ley de Hooke de la física, se puede 
demostrar que 


y=Df 
donde D es una matriz de flexibilidad. Su inversa se denomina matriz de rigidez. Describa 


el significado físico de las columnas de D y D”!. 


$*l +2 $3 

















FIGURA 1 Deflexión de una viga elástica. 


SOLUCIÓN Escriba B = [e] ez es] y observe que 
D= DI = [De; De, Dez] 


Interprete el vector e; = (1, 0, 0) como una fuerza unitaria aplicada hacia abajo en el punto 1 
(con fuerza cero en los otros dos puntos). De esta forma, De,, la primera columna de D, 
lista las deflexiones de la viga debidas a una fuerza unitaria en el punto 1. Descripciones 
similares son válidas para la segunda y tercera columnas de D. 

Para estudiar la matriz de rigidez D”!, observe que la ecuación £ = D”ly calcula un 
vector de fuerza f cuando se da un vector de deflexión y. Escriba 


D! = D“!ġh = [D'e D'e] D'e] 


Ahora interprete e, como un vector de deflexión. De esta forma, D”!e, lista las fuerzas que 
crean la deflexión. Es decir, la primera columna de D”! lista las fuerzas que deben aplicarse 
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en los tres puntos para producir una deflexión unitaria en el punto 1 y deflexión cero en los 
otros puntos. De manera similar, las columnas 2 y 3 de D”? listan las fuerzas requeridas para 
producir deflexiones unitarias en los puntos 2 y 3, respectivamente. En cada columna, una o 
dos de las fuerzas deben ser negativas (apuntan hacia arriba) para producir una deflexión uni- 
taria en el punto deseado y deflexiones cero en los otros dos puntos. Si se mide la flexibilidad, 
por ejemplo, en pulgadas de deflexión por libra de carga, entonces las entradas de la matriz de 
rigidez están dadas en libras de carga por pulgada de deflexión. a 


La fórmula del teorema 5 se utiliza muy pocas veces para resolver en forma numérica 
una ecuación Ax = b porque la reducción por filas de [A b] casi siempre es más rápida. 
(La reducción por filas también es más precisa, en general, cuando los cálculos requieren el 
redondeo de los números). Una posible excepción es el caso 2 x 2, ya que los cálculos men- 
tales para resolver Ax = b en ocasiones resultan más fáciles usando la fórmula para A”!, 
como en el siguiente ejemplo. 


EJEMPLO 4 Use la inversa de la matriz A del ejemplo 2 para resolver el sistema 
3x1 + 4x2 = 3 
5x1 + 6x2 = 7 


SOLUCIÓN Este sistema es equivalente a Ax = b, por lo que 


=a ie] allal= l-3] È 


El siguiente teorema aporta tres datos útiles acerca de las matrices invertibles. 


a) Si A es una matriz invertible, entonces A7! es invertible y 
(4D! =A 


b) Si A y B son matrices invertibles de n x n, entonces también lo es AB, y la inversa 
de AB es el producto de las inversas de A y B en el orden opuesto. Es decir, 


(AB)! =B 14"! 


c) Si A es una matriz invertible, también lo es A?, y la inversa de AT es la transpuesta 
de A”. Es decir, 


(AN a CD 


DEMOSTRACIÓN Para comprobar el enunciado a), se debe encontrar una matriz C tal que 
A`!C=I y CA! =] 


De hecho, estas ecuaciones se satisfacen colocando a A en lugar de C. Por lo tanto, AT! es 
invertible y A es su inversa. A continuación, para demostrar el enunciado b), se calcula: 


(AB)\(B7!AT') = A(BB7 ÐA! = AIAT! = AA! =I 


Un cálculo similar indica que (B7!l471X(AB) = 1. En el enunciado c) utilice el teorema 3d), 
lea de derecha a izquierda, (471747 = (AA) = I = I. De manera similar, A(A71)” = 
I7 = I. Por lo tanto, A7 es invertible, y su inversa es (A7 1)". E 


La siguiente generalización del teorema 6b) se necesitará más adelante. 


El producto de matrices invertibles de n x n es invertible, y la inversa es el producto de 
sus inversas en orden opuesto. 
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Existe una conexión importante entre las matrices invertibles y las operaciones de fila 
que conduce a un método para calcular inversas. Como se verá, una matriz invertible A es 
equivalente por filas a una matriz identidad, y es posible encontrar A"! observando la reduc- 
ción por filas de A a I. 


Matrices elementales 


Una matriz elemental es aquella que se obtiene al realizar una única operación elemental 
de fila sobre una matriz identidad. El siguiente ejemplo ilustra los tres tipos de matrices ele- 
mentales. 


EJEMPLO 5 Sean 


1 0 0 0 1 0 1 0 0 
E, = 0 1 0l| Ez=|1 0 , Ez=|0 1 0], 
-4 0 1 0 0 1 0 0 5 
a b c 
A=|d e f 
g h i 


Calcule E¡A, EA y E3A, y describa cómo se pueden obtener estos productos por medio de 
operaciones elementales de fila sobre A. 


SOLUCIÓN Compruebe que 


a b Cc d e f 
EA = d e f 4 E, A = a b c j, 
g—4a h-—4b i—á4c g h i 
a b c 
E3A= d e f 
5g 5h 5i 


Al sumar a la fila 3 la fila 1 de A multiplicada por —4, se obtiene E¡A. (Esta es una operación 
de remplazo de filas). Con un intercambio de las filas 1 y 2 de A se obtiene ÆA, y multipli- 
cando la fila 3 de A por 5 se obtiene EzA. E 


La multiplicación izquierda (es decir, multiplicación por la izquierda) por E; en el 
ejemplo 5 tiene el mismo efecto en cualquier matriz de 3 x n. Esta operación suma a la fila 3 
la fila 1 multiplicada por —4. En particular, ya que E, : 1 = E, vemos que E, se autoproduce 
mediante esta misma operación de fila sobre la identidad. Así, el ejemplo 5 ilustra la siguien- 
te propiedad general de las matrices elementales. Véase los ejercicios 27 y 28. 


Si se realiza una operación elemental de fila con una matriz A de m x n, la matriz 
resultante se puede escribir como EA, donde la matriz E de m x m se crea al realizar 
la misma operación de fila sobre Im. 


Puesto que las operaciones de fila son reversibles, como se demostró en la sección 1.1, 
las matrices elementales son invertibles, porque si £ se produce aplicando una operación de 
fila sobre Z, entonces existe otra operación de fila del mismo tipo que convierte a E de nuevo 
en Z. Por lo tanto, existe una matriz elemental F tal que FE = I. Puesto que E y F correspon- 
den a operaciones inversas, también EF = 1. 
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Toda matriz elemental Æ es invertible. La inversa de E es la matriz elemental del mismo 
tipo que transforma a E de nuevo en Z. 


1 0 0 
EJEMPLO 6 Encuentre la inversa de E] = 0O 1 0 
—4 0 1 


SOLUCIÓN Para transformar E; en Z, sume la fila 1 multiplicada por +4 a la fila 3. La matriz 
elemental que hace esto es 


1 0 0 
E'=| 0 1 0 E 
+4 0 1 


El siguiente teorema ofrece la mejor manera de “visualizar” una matriz invertible, y con- 
duce de inmediato a un método para encontrar la inversa de una matriz. 


Una matriz A de n x n es invertible si y solo si A es equivalente por filas a /,,, y, en 
este caso, cualquier secuencia de operaciones elementales de fila que reduzca A a I, 
también transforma a 1, en A7!. 


DEMOSTRACIÓN Suponga que A es invertible. Entonces, como la ecuación Ax = b tiene 
una solución para toda b (teorema 5), A tiene una posición pivote en cada fila (teorema 4 de 
la sección 1.4). Puesto que A es cuadrada, las n posiciones pivote deben estar sobre la diago- 
nal, lo que implica que la forma escalonada reducida de A es I,. Es decir, A ~ L. 

A la inversa, ahora suponga que A — /,,. Entonces, puesto que cada paso de la reducción 
por filas de A corresponde a una multiplicación izquierda por una matriz elemental, existen 
matrices elementales E.,..., Ep tales que 


A~ EA ~ EX EA) + EXE)-1 EA) = n 
Es decir, 
E, E¡A = 1, (1) 
Puesto que el producto E,,..., E; de matrices invertibles es invertible, (1) conduce a 


(Ep EDT! (Ep EA = (Ep E)" Iy 
A = (Ep E)! 


Por lo tanto, A es invertible, porque es la inversa de una matriz invertible (teorema 6). 
También, 
A7! = [(Ep EDIT} = Ep Ei 


Así, A™! = E, + Ei * [,,, lo que indica que A”! resulta de aplicar E;,..., Ep sucesivamente 
a [,, Esta es la misma secuencia en (1) que redujo A a /,. E 


Un algoritmo para determinar A~! 


Si colocamos A e Z lado a lado para formar una matriz aumentada [A Z7], entonces las 
operaciones de fila en esta matriz producen operaciones idénticas sobre A e I. De acuerdo 
con el teorema 7, hay operaciones de fila que transforman a A en Z, y a Z, en AT!, o A no es 
invertible. 
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ALGORITMO PARA DETERMINAR A”? 


Reduzca por filas la matriz aumentada [A 1]. Si A es equivalente por filas a /, en- 
tonces [A 1] es equivalente por filas a [1 A7*]. De otra manera, A no tiene inversa. 


0 1 2 
EJEMPLO 7 Encuentre la inversa de la matriz A=| 1 0 3 |, siacaso existe. 
4-3 8 
SOLUCIÓN 
0.1.2. 10.0 1 0 3 O0 1 0 
[A I]=|1 0 3 0 1 0 0. 12.100 
4-38 0 0 1 4-3 8 0 0 1 
1 0 3 0 1 0 1 0 3 0 1 0 
=|0 1 2 1 0 Ọ0 0.1.2. 10.0 
0-3-4 0-4 1 0 0 2 3 —4 1 
1 0 3 1 
~O 1 2 0 
0 0. 1 z —2 E 
1.0 0-92 7 ae 
=|0 1 0 -—2 4 
0 0 1 3/2 -2 e 
El teorema 7 señala que, como A ~ I, A es invertible, y 
—9/2 7 —3/2 
A =| -2 4 -i 
3/2 —2 1/2 
Es buena idea comprobar la respuesta final: 
0O 1 2 —9/2 7 —3/2 1 0 0 
AA =|1 0 3 -2 4 —1 |=lO0 ı 0 
4-3 8 3/2 —2 1/2 0 0 1 
No es necesario comprobar que AT!A = I, ya que A es invertible. E 


Otro punto de vista de la inversión de matrices 


Denote las columnas de /,, por ej,..., €,. De esta forma, la reducción por filas de [4 7] a 
[1 A7!] se puede ver como la solución simultánea de los n sistemas 


Ax =€, AX=t», ..., ÁAxX=€, (2) 


donde todas las “columnas aumentadas” de estos sistemas se han colocado al lado de A para 
formar [A e; @& + e,]=[A_ 17]. La ecuación AA”! = / y la definición de multiplicación 
de matrices indican que las columnas de A”! son precisamente las soluciones de los siste- 
mas de (2). Esta observación es útil porque algunos problemas aplicados requieren encontrar 
solamente una o dos columnas de A7!. En este caso, solo se necesita resolver los sistemas 
correspondientes en (2). 


2.2 








resulte más precisa. 


NOTAS NUMÉRICAS 


En la práctica, rara vez se calcula A7!, a menos que se necesiten las entradas de A””. 
Calcular tanto A7! como A” 'b requiere aproximadamente tres veces más operaciones 
aritméticas que resolver con reducción por filas Ax = b, y la reducción por filas quizá 
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1. Utilice determinantes para establecer cuáles de las siguientes matrices son invertibles: 


3 —9 
o [2 =] 


4 -9 
» [6 5] 


6 —9 
o [4] 


1 —2 —1 
2. Encuentre la inversa de la matriz A = | —1 5 6 |,siexiste. 
5-4 5 


EJERCICIOS 


Encuentre las inversas de las matrices en los ejercicios 1 a 4. 


1. 


2 


5 4) a [š 5] 
pal al 


Utilice la inversa que encontró en el ejercicio 1 para resolver 
el sistema 


8x1 + 6x2 = 2 
5x1 + 4x2 =-1 


Utilice la inversa que encontró en el ejercicio 3 para resolver el 
sistema 


7X1 + 3x2 =—9 
—6x1 E 3x2 =, 4 


1 2 -1 1 2 
Sean a=|; p=] ¿)02=[_5|19=|5| 
3 
y b4 = Ea 


a) Determine A”! y utilícela para resolver las ecuaciones 


Ax =b,, Ax = b,, Ax = b}, Ax = b4 


b) Las cuatro ecuaciones del inciso a) se pueden resolver con el 
mismo conjunto de operaciones de fila, ya que la matriz de 
coeficientes es la misma en cada caso. Resuelva las cuatro 
ecuaciones del inciso a) mediante la reducción por filas de la 
matriz aumentada [A b, b> b3 ba]. 


Suponga que P es invertible y A = PBP”!. Determine B en 
términos de A. 


En los ejercicios 9 y 10, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


9. 


10. 


11. 


12. 


13. 


a) Para que una matriz B sea la inversa de A, las ecuaciones 
AB = I y BA = I deben ser verdaderas. 


b) Si A y B son de n x n e invertibles, entonces A71B”! es la 
inversa de AB. 


Cc) Si A = Y se | yab — cd + 0, entonces A es invertible. 


d) Si A es una matriz invertible de n x n, entonces la ecuación 
Ax = b es consistente para toda b en R”. 


e) Toda matriz elemental es invertible. 


a) Si A es invertible, entonces las operaciones elementales 
de fila que reducen A a la identidad /, también reducen 
A`! ak. 

b) Si A es invertible, entonces la inversa A7! es A misma. 


c) Un producto de matrices invertibles de n x n es invertible, 
y la inversa del producto es el producto de sus inversas en el 
mismo orden. 


d) Si A es una matriz de n x n y Ax = ejes consistente para 
toda j e {1, 2,..., n}, entonces A es invertible. Nota: €1,..., €n 
representa las columnas de la matriz identidad. 

e) Si A puede reducirse por filas a la matriz identidad, entonces 
A debe ser invertible. 


Sea A una matriz invertible de n x n, y sea B una matriz de 
n x p. Demuestre que la ecuación AX = B tiene una solución 
única A7 !B. 

Utilice álgebra de matrices para demostrar que si A es inver- 
tible y D satisface AD = 1, entonces D = A”!, 


Suponga que AB = AC, donde B y C son matrices de n x p y 
A es invertible. Demuestre que B = C. ¿Esto es cierto, en ge- 
neral, cuando A no es invertible? 
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14. Suponga que (B — C)D = 0, donde B y C son matrices de 
m x ny D es invertible. Demuestre que B = C. 


15. Sea A una matriz invertible de n x n, y sea B una matriz de 
n x p. Explique por qué A”'B se puede calcular por reducción 
de filas: 


Si[A B] ==“ —[I X], entonces X= A7!B. 


Si A es mayor de 2 x 2, entonces la reducción por filas de 
[A B] es mucho más rápida que calcular a A7! y a A™!B. 


16. Suponga que A y B son matrices de n x n, B es invertible y AB 
es invertible. Demuestre que A es invertible. [Sugerencia: Con- 
sidere que C = AB, y despeje A en esta ecuación]. 


17. Suponga que A, B y C son matrices invertibles de n x n. 
Demuestre que ABC también es invertible al obtener una ma- 
triz D tal que (ABO)D = I y D(ABC) = 1. 


18. Resuelva la ecuación AB = BC para A, suponiendo que A, B 
y C son matrices cuadradas y B es invertible. 


19. Si A, B y C son matrices invertibles n x n, ¿la ecuación C~! 
(A + X)B”! = ], tiene una solución, X? Si es así, encuéntrela. 


20. Suponga que A, B y X son matrices de n x n con A, X y A — AX 
invertibles, y suponga que 
(A— AX! = XIB (3) 
a) Explique por qué B es invertible. 


b) Despeje X en la ecuación (3). Si se necesita invertir una ma- 
triz, explique por qué esta matriz es invertible. 


21. Explique por qué las columnas de una matriz A de n x n son 
linealmente independientes cuando A es invertible. 


22. Explique por qué las columnas de una matriz A de n x n ge- 
neran a R” cuando A es invertible. [Sugerencia: Repase el 
teorema 4 de la sección 1.4]. 


23. Suponga que A es de n x n y que la ecuación Ax = O tiene 
solamente la solución trivial. Explique por qué A tiene n co- 
lumnas pivote y es equivalente por filas a /,,, De acuerdo con 
el teorema 7, esto indica que A debe ser invertible. (Este ejer- 
cicio y el 24 se mencionarán en la sección 2.3). 


24. Suponga que para una matriz A de n x n, la ecuación Ax = b 
tiene una solución para toda b en R”. Explique por qué A debe 
ser invertible. [Sugerencia: ¿A es equivalente por filas a /,,?] 


Los ejercicios 
a b 

afe a 

25. Demuestre que si ad — bc = 0, entonces la ecuación Ax = 0 


tiene más de una solución. ¿Por qué esto implica que A no es in- 
vertible? [Sugerencia: Primero, considere a = b = 0. Después, 


25 y 26 demuestran el teorema 4 para 


si a y b no son ambas cero, considere el vector x = | á h 


26. Demuestre que si ad — bc + 0, la fórmula para A~! funciona. 


Los ejercicios 27 y 28 demuestran casos especiales de los hechos 
acerca de matrices elementales establecidos en el recuadro que sigue 
al ejemplo 5. Aquí A es una matriz de 3 x 3 e Z = J. (Una demos- 
tración general requeriría un poco más de notación). 


27. Sea A una matriz de 3 x 3. 


a) Use la ecuación (2) de la sección 2.1 para demostrar que 
fila; (A) = fila; (1) : A, para i = 1, 2, 3. 


b) Demuestre que si las filas 1 y 2 de A se intercambian, en- 
tonces el resultado se puede escribir como EA, donde E 
es una matriz elemental formada al intercambiar las filas 1 
y 2 de /. 


c) Demuestre que si la fila 3 de A se multiplica por 5, enton- 
ces el resultado se puede escribir como EA, donde E se 
forma al multiplicar la fila 3 de / por 5. 


28. Suponga que se remplaza la fila 2 de A por filaz (A) — 3 - fila, (4). 
Demuestre que el resultado es EA, donde E se forma a partir de 
I al remplazar fila) (D) por fila, (1) — 3 : fila; (4). 


Encuentre las inversas de las matrices en los ejercicios 29 a 32, si 
existen. Use el algoritmo presentado en esta sección. 


b 3 3 6 
s[i] TH 
1 E 1 2 -l 
31. | -3 1 4 32. | -4 -7 3 
2 4 -2 -6 4 


33. Use el algoritmo de esta sección para encontrar las inversas de 


ò 0 
0l|y 
1 


Rh o a pu 


0 
1 
1 
1 


ooo 


0 
1 
1 
Sea A la matriz de n x n correspondiente, y sea B su inversa. 


Infiera la forma de B, y después demuestre que AB = 1. 


34. Repita la estrategia del ejercicio 33 para inferir la inversa B de 


1 0o 0 ... 0 
2 2 0 0 


Demuestre que AB = 1. 


-1 -7 -3 
35. Sea A = 2 15 6 |. Encuentre la tercera columna de 
1 3 2 


A”! sin calcular las otras columnas. 


—25 =9  -27 
36. [M] Sea A= | 536 185 537 
154 52 143 


. Encuentre la segunda 


y tercera columnas de A”! sin calcular la primera columna. 


2 
37. Sea A=| 1 3 
1 5 


. Construya una matriz C de 2 x 3 (por 


prueba y error) usando sólo 1, —1 y O como entradas, de tal 
forma que CA = h. Calcule AC y observe que AC + h. 


38. 


1 -1 1 


sea a= fo 1 


0 . 
l Construya una matriz D, de 


4 x 2, usando solo 1 y O como entradas, de tal forma 
que AD = h. ¿Es posible que CA = l4 para alguna matriz C 
de 4 x 2? ¿Por qué? 


39. [M] Sea 
.011  .003  .001 
D = | .003 6.009 .003 
.001 .003 Oll 


40. 


una matriz de flexibilidad, con la flexibilidad medida en pul- 
gadas por libra. Suponga que se aplican fuerzas de 40, 50 y 
30 lb sobre los puntos 1, 2 y 3, respectivamente, en la figura 1 
del ejemplo 3. Encuentre las deflexiones correspondientes. 


[M] Encuentre la matriz de rigidez D”' para la D del ejer- 
cicio 39. Liste las fuerzas que se necesitan para producir una 
deflexión de .04 pulgadas en el punto 3, con deflexión cero en 


41. 


42. 
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[M] Sea 
.0130  .0050  .0020  .0010 
D= .0050  .0100  .0040  .0020 
~ | .0020 .0040  .0100  .0050 
.0010 .0020 .0050 .0130 


la matriz de flexibilidad para una viga elástica, como la del 
ejemplo 3, con cuatro puntos en los que se aplican fuerzas. 
Las unidades son centímetros por newton de fuerza. Las me- 
diciones en los cuatro puntos identifican deflexiones de .07, 
.12, .16 y .12 cm. Determine las fuerzas presentes en los cua- 
tro puntos. 


[M] Con D como en el ejercicio 41, determine las fuerzas que 
producen una deflexión de .22 cm en el segundo punto de la 
viga, con deflexión cero en los otros tres puntos. ¿Cómo están 
relacionadas la respuesta al problema y las entradas de D”!? 
[Sugerencia: Primero conteste la pregunta para una deflexión 
de 1 cm en el segundo punto]. 


los otros puntos. 


2.3 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 
3 —9 
2 6 


cero, de manera que la matriz es invertible. 


b) de de] = 4-5 — (—9) -0 = 20 Æ 0. La matriz es invertible. 


1. a) der| | = 3-6 — (—9) -2 = 18 + 18 = 36. El determinante es diferente de 


c) det | S a = 6-6 — (—9)(—4) = 36 — 36 = 0. La matriz no es invertible. 
1 —2 -1 1.0.0 
2. [4 I]=|-1 5 6 0 1 0 
5-4 5 0 0 1 
1-2 -—1 1 0 0 
=|0 3 5 1 1 0 
0 6 10 -5 0 1 
1 —2 -l1 1 0 0 
~] O0 3 5 1 1 0 
0 0 0-7-2 1 


Así, [A 1] es ahora equivalente por filas a la matriz de la forma [B D], donde B es una 
matriz cuadrada y tiene una fila de ceros. Las operaciones de fila adicionales no van a 
transformar a B en J, así que el proceso se detiene. A no tiene una inversa. 


CARACTERIZACIONES DE MATRICES INVERTIBLES 


Esta sección constituye un repaso de la mayoría de los conceptos estudiados en el capítulo 1, 
en relación con sistemas de n ecuaciones lineales de n incógnitas y con matrices cuadradas. 
El resultado principal es el teorema 8. 
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TEOREMA 8 


(a) 
NES 
(b) G) 
N Y 


© < (d) 
FIGURA 1 


(k) 
Z A 
(a) <= (2) 
(8) Y UM)  U 
(d) (e) = (6) 


(a) <> 0 


El teorema de la matriz invertible 


Sea A una matriz cuadrada de n x n. Entonces, los siguientes enunciados son equiva- 
lentes. Es decir, para una A dada, los enunciados son todos ciertos o todos falsos. 


a) A es una matriz invertible. 

b) A es equivalente por filas a la matriz identidad de n x n. 

c) A tiene n posiciones pivote. 

d) La ecuación Ax = 0 tiene solamente la solución trivial. 

e) Las columnas de A forman un conjunto linealmente independiente. 
f) La transformación lineal x > Ax es uno a uno. 

g) La ecuación Ax = b tiene al menos una solución para toda b en R”. 
h) Las columnas de A generan R”. 

i) La transformación lineal x > Ax mapea R” sobre R”. 

j) Existe una matriz C de n x n tal que CA = I, 

k) Existe una matriz D de n x n tal que AD = 1. 


[) AT es una matriz invertible. 


Primero, se necesita alguna notación. Si la veracidad del enunciado a) siempre implica 
que el enunciado j) sea cierto, se dice que a) implica a j), y esto se representa como a) = j). 
La demostración establecerá el “círculo” de implicaciones que se ilustra en la figura 1. Si 
cualquiera de estos cinco enunciados es cierto, entonces también lo son los demás. Por úl- 
timo, la demostración relacionará los enunciados restantes del teorema con los enunciados 
incluidos en este círculo. 


DEMOSTRACIÓN Si el enunciado a) es cierto, entonces A~! funciona para C en j), de ma- 
nera que a) = j). Luego, j) => d) por el ejercicio 23 de la sección 2.1. (Regrese y lea el 
ejercicio). También, d) = c) por el ejercicio 23 de la sección 2.2. Si A es cuadrada y tiene 
n posiciones pivote, entonces los pivotes deben estar sobre la diagonal principal; en tal 
caso, la forma escalonada reducida de A es /,,. Por lo tanto, c) => b). También, b) = a) por 
el teorema 7 de la sección 2.2. Esto completa el círculo de la figura 1. 

Ahora, a) = k) porque A`! funciona para D. También, k) = g) por el ejercicio 26 de 
la sección 2.1, y g) = a) por el ejercicio 24 de la sección 2.2. Así que g) y k) están vincu- 
lados al círculo. Además, g), h) e i) son equivalentes para cualquier matriz, de acuerdo con 
el teorema 4 de la sección 1.4 y el teorema 12a) de la sección 1.9. Por consiguiente, h) e i) 
están vinculados al círculo a través de g). 

Como d) está vinculado al círculo, también lo están e) y f), porque d), e) y f) son todos 
equivalentes para cualquier matriz A. [Véase la sección 1.7 y el teorema 12b) de la sección 
1.9]. Por último, a) => !) de acuerdo con el teorema 6c) de la sección 2.2, y D = a) por el 
mismo teorema intercambiando A y A”. Esto completa la demostración. E 


Según el teorema 5 de la sección 2.2, el enunciado g) del teorema 8 también se podría 
escribir como: “La ecuación Ax = b tiene una solución única para toda b en [R””. Este enun- 
ciado realmente implica a b) y, por lo tanto, implica que A es invertible. 

El siguiente hecho es consecuencia del teorema 8 y del ejercicio 12 de la sección 2.2. 


Sean A y B matrices cuadradas. Si AB = 1, entonces A y B son invertibles, con B = A~! 
yA=B"!, 
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El teorema de la matriz invertible divide al conjunto de todas las matrices de n x n en 
dos clases disjuntas: las matrices invertibles (no singulares) y las matrices no invertibles (sin- 
gulares). Cada enunciado del teorema describe una propiedad de toda matriz de n x n inver- 
tible. La negación de un enunciado del teorema describe una propiedad de toda matriz 
singular de n x n. Por ejemplo, una matriz singular de n x n no es equivalente por filas a /,, 
no tiene n posiciones pivote, y tiene columnas linealmente dependientes. Las negaciones de 
los otros enunciados se consideran en los ejercicios. 


EJEMPLO 1 Use el teorema de la matriz invertible para determinar si A es invertible: 


1 0-2 
A= 3 1-2 
5-1 9 
SOLUCIÓN 
1 0-2 1 0-2 
A=|0 1 4|=|0 1 4 
0 -1 -1 0 0 3 


Por lo que A tiene tres posiciones pivote y, por lo tanto, es invertible, de acuerdo con el enun- 
ciado c) del teorema de la matriz invertible. A 


El poder del teorema de la matriz invertible radica en las relaciones que establece entre 
tantos conceptos importantes, tales como la independencia lineal de las columnas de una 
matriz A y la existencia de soluciones para ecuaciones de la forma Ax = b. Sin embargo, se 
debe enfatizar que el teorema de la matriz invertible se aplica solo a matrices cuadradas. Por 
ejemplo, si las columnas de una matriz de 4 x 3 son linealmente independientes, no puede 
usarse el teorema de la matriz invertible para obtener cualquier conclusión acerca de la exis- 
tencia o inexistencia de soluciones a ecuaciones de la forma Ax = b. 


Transformaciones lineales invertibles 


Recuerde de la sección 2.1 que la multiplicación de matrices corresponde a la composición 
de transformaciones lineales. Cuando una matriz A es invertible, la ecuación AT! AX = x se 
puede ver como un enunciado acerca de transformaciones lineales. Véase la figura 2. 


Multiplicación 
por A 


xo e Ax 
Multiplicación 


por A7! 
FIGURA 2 A`! transforma Ax de regreso a x. 


Se dice que una transformación lineal T : R” —> R” es invertible si existe una función 
S : R” — R” tal que 


S(T(x)) =x para toda x en R” (1) 
T(S(x)) =x para toda x en R” (2) 


El siguiente teorema establece que si dicha S existe, es única y debe ser una transformación 
lineal. Se dice que S es la inversa de T y se escribe como T”?. 
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TEOREMA 9 


Sea T : R” — R” una transformación lineal y sea A la matriz estándar para T. Así, 
T es invertible si y solo si A es una matriz invertible. En tal caso, la transforma- 
ción lineal S dada por S(x) = A` !x es la única función que satisface las ecuaciones 


a)y 2). 


DEMOSTRACIÓN Suponga que T es invertible. Entonces (2) indica que T es sobre R”, 
porque si b está en R” y x = S(b), entonces T(x) = T(S(b)) = b, así que toda b está en el 
rango de T. Por lo tanto, A es invertible, de acuerdo con el teorema de la matriz invertible, 
enunciado i). 

Por el contrario, suponga que A es invertible y sea S(x) = A7!x. Entonces, S es una trans- 
formación lineal y evidentemente satisface (1) y (2). Por ejemplo, 


S(T(X)) = S(Ax) = A7 !(Ax) = x 


Por consiguiente, T es invertible. La demostración de que S es única se describe de manera 
general en el ejercicio 38. E 


EJEMPLO 2 ¿Qué se puede decir acerca de una transformación lineal T uno a uno 
de R” en R”? 


SOLUCIÓN Las columnas de la matriz estándar A de T son linealmente independientes 
(según el teorema 12 de la sección 1.9). Por lo que A es invertible, de acuerdo con el teo- 
rema de la matriz invertible, y T mapea R” sobre R”. También, T es invertible, según el 
teorema 9. E 


NOTAS NUMÉRICAS 





En la práctica, se puede encontrar ocasionalmente una matriz “casi singular” o mal 
condicionada: una matriz invertible que puede convertirse en singular si algunas 
de sus entradas se modifican ligeramente. En este caso, es posible que la reducción 
por filas produzca menos de n posiciones pivote, debido al error de redondeo. Ade- 
más, los errores de redondeo, algunas veces, hacen que una matriz singular parezca 
invertible. 

Algunos programas de matrices calculan un número de condición para una ma- 


triz cuadrada. Cuanto mayor sea el número de condición, más cerca estará la matriz de 
ser singular. El número de condición de la matriz identidad es 1. Una matriz singular 
tiene un número de condición infinito. En casos extremos, un programa de matrices 
podría no distinguir entre una matriz singular y una matriz mal condicionada. 

Los ejercicios 41 a 45 ponen de manifiesto que los cálculos de matrices llegan 
a producir errores sustanciales cuando un número de condición es grande. 


PROBLEMAS DE PRÁCTICA 


2 3 4 
1. Determine si A=| 2 3 4 |es invertible. 
2 3 4 


2. Suponga que para cierta matriz A de n x n, el enunciado g) del teorema de la matriz 
invertible no es verdadero. ¿Qué puede decirse acerca de las ecuaciones de la forma 
Ax = b? 

3. Suponga que A y B son matrices de n x n y que la ecuación ABx = Ú tiene una solu- 
ción no trivial. ¿Qué puede decirse acerca de la matriz AB? 


2.3 EJERCICIOS 


A menos que se especifique lo contrario, suponga que en estos ejer- 
cicios todas las matrices son de n x n. En los ejercicios 1 a 10, de- 
termine cuáles de las matrices son invertibles. Use tan pocos cálculos 
como sea posible. Justifique sus respuestas. 


TER 


> 


10. 





ale] 


T3 0 0 -5 1 4 
=3 4% 30 4. 0.0.0 
| 8 5-3 1 4 9 
M E l -3 -6 
2 0 4 6. 0 4 3 
| -4 0 -3 6 0 
-1 -3 0 1 3 4 7 4 
3. e 3 0 1 4 6 
—2 —6 3 a 5 E 0 2 
[ 0-1 2-1 0 0 0 1 
4 0-3 -7 
6 9 9 9 
MI] 7 -5 10 19 
-1 2 4-1 
5 3 1 7 9 
6 4 2 8 -8 
M]I|7 5 3 10 9 
9 6 4 -9 -5 
8 5 2 11 4 


En los ejercicios 11 y 12, todas las matrices son n x n. Cada inciso 
de estos ejercicios es una implicación de la forma “si (enunciado 1), 
entonces (enunciado 2)”. Marque cada implicación como verdadera 
o falsa, considerando lo siguiente. Una implicación es verdadera si 
el enunciado 2 es verdadero siempre que el enunciado 1 sea cierto. 
Una implicación es falsa si existe un caso en el que el enunciado 2 es 
falso, pero el enunciado 1 es verdadero. Justifique sus respuestas. 


11. a) Si la ecuación Ax = 0 tiene únicamente la solución trivial, 


12. 


b) 


c) 


e) 


b) 


c) 


entonces A es equivalente por filas a la matriz identidad de 
nxn. 


Si las columnas de A generan a R”, entonces las columnas 
son linealmente independientes. 


Si A es una matriz de n x n, entonces la ecuación Ax = b 
tiene al menos una solución para toda b en R”. 


Si la ecuación Ax = 0 tiene una solución no trivial, enton- 
ces A tiene menos de n posiciones pivote. 


Si A7 no es invertible, entonces A no es invertible. 


Si existe una matriz D de n x n tal que AD = I, entonces 
DA =1. 


Si la transformación lineal x > Ax mapea R” en R”, enton- 
ces la forma escalonada reducida de A es /. 


Si las columnas de A son linealmente independientes, enton- 
ces las columnas de A generan a RR”. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


21. 


22. 


23. 


24. 


25. 
26. 


27. 


28. 


29. 
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d) Sila ecuación AX = b tiene al menos una solución para toda b 
en R”, entonces la transformación x > Ax no es uno a uno. 


e) Si existe una b en R” tal que la ecuación Ax = b es con- 
sistente, entonces la solución es única. 


Una matriz triangular superior de m x n es aquella cuyas 
entradas debajo de la diagonal principal son ceros (como en el 
ejercicio 8). ¿Cuándo es invertible una matriz triangular supe- 
rior cuadrada? Justifique su respuesta. 


Una matriz triangular inferior de m x n es aquella cuyas 
entradas arriba de la diagonal principal son ceros (como en el 
ejercicio 3). ¿Cuándo es invertible una matriz triangular inferior 
cuadrada? Justifique su respuesta. 


¿Puede ser invertible una matriz de 4 x 4, cuando sus columnas 
no generan a R4? ¿Por qué? 
Si una matriz A de n x n es invertible, entonces las columnas 


de A” son linealmente independientes. Explique por qué. 


¿Puede una matriz cuadrada con dos columnas idénticas ser 
invertible? ¿Por qué? 


¿Puede una matriz cuadrada con dos filas idénticas ser inver- 
tible? ¿Por qué? 


Si las columnas de una matriz D, de 7 x 7, son linealmente 
independientes, ¿qué se puede decir acerca de las soluciones 
de Dx = b? ¿Por qué? 


. Si A es una matriz de 5 x 5 y la ecuación Ax = b es consistente 


para toda b en RÍ, ¿es posible que, para alguna b, la ecuación 
Ax = b tenga más de una solución? ¿Por qué? 


Si la ecuación Cu = v tiene más de una solución para alguna 
v en R”, ¿pueden las columnas de la matriz C de n x n generar 
a R”? ¿Por qué? 


Si las matrices E y F de n x n tienen la propiedad de que 
EF = I, entonces E y F conmutan. Explique por qué. 


Suponga que F es una matriz de n x n. Si la ecuación Fx = y 
es inconsistente para alguna y en R”, ¿qué se puede decir acerca 
de la ecuación Fx = 0? ¿Por qué? 


Si una matriz G de n x n no se puede reducir por filas a In, 
¿qué se puede decir acerca de las columnas de G? ¿Por qué? 


Compruebe el enunciado del recuadro antes del ejemplo 1. 


Explique por qué las columnas de A? generan a R” siempre que 
las columnas de una matriz A de n x n son linealmente inde- 
pendientes. 


Sean A y B matrices de n x n. Demuestre que si AB es invertible, 
también lo es A. No podrá utilizar el teorema 6b), porque no es 
posible suponer que A y B son invertibles. [Sugerencia: Existe 
una matriz W tal que ABW = I. ¿Por qué?]. 


Sean A y B matrices de n x n. Demuestre que si AB es inver- 
tible, también B lo es. 


Si A es una matriz de n x n y la transformación x > Ax es uno 
a uno, ¿qué más puede decirse acerca de esta transformación? 
Justifique su respuesta. 
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30. SiA es una matriz de n x n y la ecuación Ax = b tiene más de 
una solución para alguna b, entonces la transformación x > Ax 
no es uno a uno. ¿Qué más se puede decir acerca de esta trans- 
formación? Justifique su respuesta. 


31. Suponga que A es una matriz de n x n con la propiedad de que 
la ecuación Ax = b tiene al menos una solución para toda b 
en R”. Sin utilizar los teoremas 5 u 8, explique por qué cada 
ecuación Ax = b tiene, en efecto, exactamente una solución. 


32. Suponga que A es una matriz de n x n con la propiedad de que 
la ecuación Ax = 0 tiene solamente la solución trivial. Sin uti- 
lizar el teorema de la matriz invertible, explique directamente 
por qué la ecuación Ax = b debe tener una solución para toda 
b en R”. 


En los ejercicios 33 y 34, T es una transformación lineal de R? en R?. 
Demuestre que T es invertible y encuentre una fórmula para T7!. 


33. T(x¡, x2) = (—5x1 + 9x2, 4x1 — 7x2) 
34. T(x, X2) e (2x1 = 8x2, —2x1 + 7x2) 


35. Sea T: R” — R” una transformación lineal invertible. Expli- 
que por qué T es tanto uno a uno como sobre R”. Use las ecua- 
ciones (1) y (2). Después, dé una segunda explicación usando 
uno o más teoremas. 


36. Suponga una transformación lineal T : R” —> R” con la pro- 
piedad de que T(u) = T(v) para algún par de vectores distintos 
u y v en R”. ¿Puede T mapear R” sobre R”? ¿Por qué? 


37. Suponga que T y U son transformaciones lineales de R” a 
R” tales que T(U(x)) = x para toda x en R”. ¿Es cierto que 
U(T(x)) = x para toda x en R”? ¿Por qué? 


38. Sea T: R” — R” una transformación lineal invertible, y sean 
S y U funciones de R” en [R” tales que S(T(x)) = X y 
U(T(x)) = x para toda x en R”. Demuestre que U(v) = S(v) 
para toda v en R”. Esto demostrará que T tiene una inversa 
única, como se establece en el teorema 9. [Sugerencia: Dada 
cualquier v en R”, se puede escribir v = T(x) para alguna x. 
¿Por qué? Calcule S(v) y U(v)]. 


39. Sea T una transformación lineal que mapea R” sobre R”. 
Demuestre que T 7! existe y mapea R” en R”. ¿T 7! es también 
uno a uno? 


40. Suponga que T y S satisfacen las ecuaciones de invertibilidad 
(1) y Q), donde T es una transformación lineal. Demuestre di- 
rectamente que S es una transformación lineal. [Sugeren- 
cia: Dadas u y v en [R”, sea x = S(u), y = S(v). Entonces, 
T(x) = u, T(y) = v. ¿Por qué? Aplique S a ambos miembros 
de la ecuación T(x) + T(y) = T(x + y). También, considere 
T(cx) = cT(x)]. 


41. 


[M] Suponga que un experimento conduce al siguiente sistema 
de ecuaciones: 


4.5x1 + 3.1x2 = 19.249 


6) 
1.6x1 + 1.12 = 6.843 


a) Resuelva el sistema (3), y después resuelva el sistema (4) 
que se presenta a continuación, en el cual los datos a la dere- 
cha se redondearon a dos decimales. En cada caso, encuentre 
la solución exacta. 
4.5x1 + 3.1x, = 19.25 


(4) 
1.6x1 + 1.1x, = 6.84 


b) Las entradas del sistema (4) difieren de las del sistema (3) en 
menos del .05%. Encuentre el porcentaje de error cuando se 
utiliza la solución de (4) como una aproximación a la solu- 
ción de (3). 

c) Use un programa de matrices para producir el número de 
condición de la matriz de coeficientes de (3). 


Los ejercicios 42, 43 y 44 ilustran cómo utilizar el número de con- 
dición de una matriz A para estimar la exactitud de una solución 
calculada de Ax = b. Si las entradas de A y b son exactas con apro- 
ximadamente r dígitos significativos, y si el número de condición 
de A es aproximadamente 10* (siendo k un entero positivo), entonces 
la solución calculada de Ax = b debería ser exacta hasta al menos 
r — k dígitos significativos. 


42. 


43. 
44. 


45. 


[M] Sea A la matriz del ejercicio 9. Encuentre el número de 
condición de A. Construya un vector aleatorio x en R4 y calcule 
b = Ax. Después use un programa de matrices para calcular la 
solución x; de Ax = b. ¿En cuántos dígitos concuerdan x y xj? 
Encuentre el número de dígitos que el programa de matrices 
almacena con precisión, e informe cuántos dígitos de exactitud 
se pierden cuando se usa x, en lugar de la solución exacta X. 


[M] Repita el ejercicio 42 para la matriz del ejercicio 10. 


[M] Resuelva la ecuación Ax = b para obtener una b que sirva 
para encontrar la última columna de la inversa de la matriz de 
Hilbert de quinto orden 


1 1/2 1/3 1/4 1/5 
1/2 1/3 1/4 1/5 el 
A=| 1/3 1/4 1/5 1/6 1/7 
1/4 1/5 1/6 1/7 1/8 
Lys 1/6 1/7 1/8 1/9 
¿Cuántos dígitos de cada entrada de x espera que sean correc- 


tos? Explique su respuesta. [Nota: La solución exacta es (630, 
— 12600, 56700, —88200, 44100)]. 


[M] Algunos programas de matrices, como MATLAB, tienen 
una orden para crear matrices de Hilbert de varios tamaños. Si 
es posible, use un comando inverso para calcular la inversa de 
una matriz de Hilbert A de duodécimo orden o mayor. Calcule 
AA” 1, Realice un informe de sus hallazgos. 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Es evidente que las columnas de A son linealmente dependientes, ya que las columnas 
2 y 3 son múltiplos de la columna 1. Por lo tanto, A no puede ser invertible, de acuerdo 
con el teorema de la matriz invertible. 


2. Si el enunciado g) no es verdadero, entonces la ecuación Ax = b es inconsistente para al 
menos una b en R”. 


3. Aplique el teorema de la matriz invertible a la matriz AB en lugar de A. Entonces, el enun- 
ciado d) se convierte en: “ABx = 0 tiene solamente la solución trivial”. Esto no es cierto. 
Por lo tanto, AB no es invertible. 


2.4 | MATRICES PARTICIONADAS 


Una característica clave de nuestro trabajo con matrices ha sido la capacidad para considerar 
a una matriz A como una lista de vectores columna y no tan solo un arreglo rectangular de 
números. Este punto de vista ha resultado tan útil que sería deseable considerar otras parti- 
ciones de A, indicadas por las líneas divisorias horizontales y verticales, como en el ejemplo 
1 que se presenta a continuación. Las matrices particionadas se presentan en la mayoría de las 
aplicaciones modernas del álgebra lineal porque la notación resalta la estructura esencial de 
los cálculos matriciales, como se mostró en el ejemplo introductorio de este capítulo acerca 
del diseño de aeronaves. Esta sección ofrece una oportunidad para revisar el álgebra matricial 
y usar el teorema de la matriz invertible. 


EJEMPLO 1 La matriz 





3 0 -1]5 9 =2 
alas 2 4ļl0o 3] ı 
-8 -6 3ļ|1ı A 


también se puede escribir como la matriz particionada de 2 x 3 (o por bloques) de 


A= Au An Ag 
An An Áz 


cuyas entradas son los bloques (o las submatrices) 


3 0-1 5 9 —2 
aiaj; 2 A a=l ai an=] l 


Aa =|-8 -6 3], A»=[1 7], A43 =[|—4] E 


EJEMPLO 2 Cuando una matriz A se presenta en un modelo matemático de un sis- 
tema físico, como en una red eléctrica, un sistema de transporte o una gran compañía, tal 
vez resulte natural considerar A como una matriz particionada. Por ejemplo, si un tablero de 
circuitos de microcomputadora consta principalmente de tres microcircuitos VLSI (very 
large-scale integrated, es decir, integrados a escala muy grande), entonces la matriz para el 
tablero de circuitos podría tener la forma general 


Anı | An | Ag 


A= | An | An | Az 
Az | Az | As 














Las submatrices en la “diagonal” de A —a saber, A11, A22 y A33— se refieren a los tres cir- 
cuitos VLSI, mientras que las otras submatrices dependen de las interconexiones que haya 
entre esos microcircuitos. E 
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Suma y multiplicación escalar 


Si las matrices A y B son del mismo tamaño y están particionadas exactamente en la mis- 
ma forma, resulta natural efectuar una partición similar de la suma ordinaria matricial A + B. 
En este caso, cada bloque de A + B es la suma (matricial) de los bloques correspondientes 
de A y B. La multiplicación por un escalar de una matriz particionada también se calcula 
bloque por bloque. 


Multiplicación de matrices particionadas 


Las matrices particionadas se pueden multiplicar utilizando la regla fila-columna como si las 
entradas del bloque fueran escalares, siempre que para un producto AB, la partición por 
columnas de A equivalga a la partición por filas de B. 


EJEMPLO 3 Sean 








6 4 
2 -3 1]0 —4 -2 1 
q io E E E F> a palen y afa] 
Pa a Ei Pr Y 2 
5 2 


Las cinco columnas de A están particionadas en un conjunto de tres columnas y, luego, 
en uno de dos columnas. Las cinco filas de B están particionadas de igual manera (en un 
conjunto de tres filas y después en uno de dos filas). Se dice que las particiones de A y B es- 
tán conformadas para la multiplicación por bloques. Es posible demostrar que el producto 
común AB se escribe como 





-5 4 
AB= Au An||Bi| _|41B1+4nB2 | _ 6 2 
Azn An || B2 A2 Bı + A2 B2 z 


Es importante escribir cada producto menor de la expresión para AB con la submatriz 
de A a la izquierda, ya que la multiplicación de matrices no es conmutativa. Por ejemplo, 


6 4 
2 ¿=3 3 dl 15 12 
1t 5 -2 2 -5 
=3- 


O -41T-1 3 20 -8 
anb =| al 5 al=f -8 J 


Por lo tanto, el bloque superior es 


15 12 —20 —8 —5 4 
A1 Bı + A2 B2 = | 2 za +| —8 j = E al 
E 


La regla fila-columna para la multiplicación de matrices por bloques ofrece la manera 
más general de considerar un producto de dos matrices. Cada una de las siguientes formas 
de ver un producto ya se describió mediante particiones sencillas de matrices: 1. la defini- 
ción de Ax usando las columnas de A, 2. la definición de columna de AB, 3. la regla fila- 
columna para calcular AB, y 4. las filas de AB como productos de las filas de A y la matriz 
B. Una quinta manera de ver AB, usando de nuevo particiones, se presentará más adelante 
en el teorema 10. 

Los cálculos del siguiente ejemplo preparan el camino para el teorema 10. Aquí, coly(A) 
es la k-ésima columna de A, y la fila; (B) es la k-ésima fila de B. 
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EJEMPLO 4 Sea A= | T ;|y8= c d |. Compruebe que 
e f 
AB = col;(4) fila¡(B) + col2(4) fila,(B) + colx(A4) fila3(B) 


SOLUCIÓN Cada uno de los términos anteriores es un producto externo. (Véase los ejerci- 
cios 27 y 28 de la sección 2.1). Por la regla fila-columna para calcular un producto matricial, 


col¡(4) fila¡(B) = [Jrs b]= le El 


a 


E c d 
~ | —4c —4d 


col¿(A) fila3(B) = | d [ e f ] E | e a | 


Ly 


col(4) filar(B) = [4] [c d 


De modo que 


3 
e col(A) fila(B) = 


[Pc se 
k=1 


a— 4c + 5e b—4d + 5f 


Es evidente que esta matriz es AB. Observe que la entrada (1, 1) de AB es la suma de las 
entradas (1, 1) de los tres productos externos, la entrada (1, 2) en AB es la suma de las entra- 
das (1, 2) de los tres productos externos, y así sucesivamente. A 


TEOREMA 10 Expansión columna-fila de AB 


Si A es de m x n y B es de n x p, entonces 


fila¡(B) 
filar(B) 
AB = [col¡(4) col (4) =- col,(A)] : 


fila,(B) 
= col; (4) fila,(B) + -+ + col, (4) fila,(B) 


DEMOSTRACIÓN Para cada índice de fila i e índice columna j, la entrada (i, j) en col(A) 
fila(B) es el producto de az de col(A) y by; de filax(B). Por lo tanto, la entrada (i, j) de la suma 
que se muestra en la ecuación (1) es 


ajñbiy + pb + > + dinbnj 
(k= 1) (k = 2) (k =n) 


Esta suma también es la entrada (1, j) de AB, por la regla fila-columna. E 


Inversas de matrices particionadas 


El siguiente ejemplo ilustra los cálculos relacionados con inversas y matrices particionadas. 


EJEMPLO 5 Se dice que una matriz de la forma 


_ | 41 áv 
[o dl 


es triangular superior por bloques. Suponga que A; es de p x p, A», es de q X q, y A in- 
vertible. Encuentre una fórmula para A”. 
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SOLUCIÓN Denote A”! con B, y efectúe una partición de B para que 
Au Anf|Bu Br|_|!p» 0 
0 An || Ba Bz 0 4 0) 
Esta ecuación matricial proporciona cuatro ecuaciones que conducen a los bloques des- 


conocidos B;¡,..., B22. Calcule el producto a la izquierda de (2), e iguale cada entrada con el 
bloque correspondiente en la matriz identidad a la derecha. Es decir, establezca 


A11Bi1 + ApBa = Ll, 6) 
A11B1 + AnBz =0 (4) 
AB =0 (5) 
AvB» = 4 (6) 


Por sí misma, (6) no establece que A», sea invertible. Sin embargo, ya que A», es cuadrada, el 
teorema de la matriz invertible y (6), juntos, indican que A», es invertible y B», = Az. Ahora, 
al multiplicar por la izquierda ambos lados de (5) por A3, se obtiene 

Ba = Az 0 =0 
por lo que (3) se simplifica a 

A11B:1 + 0 = Íp 


Ya que A4; es cuadrada, esto demuestra que A4; es invertible y B1; = AÑ. Por último, usando 
estos resultados con la ecuación (4) se encuentra que 


AB = -—AnB2=-AnAy y Bn = -AR AnAz 


Así, 
m -1 -1 -1 
A! = An An = n 4n 4242 E 
0 A 0 Aj 


Una matriz diagonal por bloques es una matriz particionada con bloques cero fuera de 
la diagonal (de bloques) principal. Una matriz de este tipo es invertible si y solo si cada blo- 
que sobre la diagonal es invertible. Véase los ejercicios 13 y 14. 


NOTAS NUMÉRICAS 





1. Cuando las matrices son demasiado grandes para caber en la memoria de alta ve- 
locidad de una computadora, particionarlas permite trabajar solamente con dos o 
tres submatrices a la vez. Por ejemplo, un equipo de investigación de programa- 
ción lineal simplificó un problema al particionar la matriz en 837 filas y 51 co- 
lumnas. La solución del problema tardó aproximadamente cuatro minutos en una 
supercomputadora Cray.! 


Algunas computadoras de alta velocidad, en particular aquellas con arquitectura 
de conducción vectorial, realizan cálculos matriciales con mayor eficiencia cuando 
los algoritmos usan matrices particionadas.? 


Los programas de computadora profesionales para álgebra lineal numérica de alto 
desempeño, como LAPACK, utilizan de manera intensiva cálculos de matrices 
particionadas. 


1 E] tiempo de solución no parece muy impresionante hasta saber que cada bloque de las 51 columnas contenía, 
aproximadamente, 250,000 columnas individuales. ¡El problema original tenía 837 ecuaciones y más de 12,750,000 
variables! Casi 100 millones de las más de 10 mil millones de entradas eran diferentes de cero. Véase Robert E. 
Bixby et al., “Very Large-Scale Linear Programming: A Case Study in Combining Interior Point and Simplex 
Methods”, Operations Research, 40, núm. 5 (1992): 885-897. 

2 La importancia de los algoritmos de matrices por bloques para cálculos de computadora se describe en Matrix 
Computations, 3a. ed., de Gene H. Golub y Charles E. van Loan (Baltimore: Johns Hopkins University Press, 1966). 


2. 
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Los siguientes ejercicios permiten obtener práctica con el álgebra matricial e ilustran los 
cálculos comunes que se encuentran en aplicaciones. 


PROBLEMAS DE PRÁCTICA 


I 


0 
1. Demuestre que | A J es invertible y encuentre su inversa. 


2. Calcule XTX, donde X está particionada como [X; 


4 EJERCICIOS 


En los ejercicios 1 a 9, suponga que las matrices están particionadas 
de manera conformada para la multiplicación por bloques. Calcule 
los productos que se indican en los ejercicios 1 a 4. 


3. 


[e nlle o) 
[r olle 2] 


Lo elle $) 


“Le rllr 2 


En los ejercicios 5 a 8, encuentre fórmulas para X, Y y Z, en términos 
de A, B y C, y justifique sus cálculos. En algunos casos, tendrá que 
hacer suposiciones acerca del tamaño de una matriz para obtener una 
fórmula. [Sugerencia: Calcule el producto a la izquierda e iguálelo 
al lado derecho]. 


9 


An 


A 


e 


10. 


E e 
El 
[r os] 


A B||X Y Z| |700 
p A 0 isla 0 7] 
Suponga que Bıı es una matriz invertible. Encuentre las ma- 
trices A21 y A31 (en términos de los bloques de B) de tal mane- 
ra que el producto que aparece a continuación tenga la forma 
indicada. Además, calcule C22 (en términos de los bloques de 


B). [Sugerencia: Calcule el producto a la izquierda e iguálelo al 
lado derecho]. 


I 0 0 Bı Bi Cu Cp 
An I 0|| Ba Ba|=| 0 Ca 
A3 0 1 || B3 Bz 0 Cz 


La inversa de 
I 0 0 I 0 0 
A I Ojes| P I 0 
B D I Q R I 


Encuentre P, Q y R. 


X2]. 


En los ejercicios 11 y 12, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


11. 


12. 


13. 


14. 


15. 


a) Si A = [41 42] y B = [Bı B2], con Aı y A2 de las mis- 
mas dimensiones que Bı y B2, respectivamente, entonces 
A + B= [A + B; Az + Ba]. 

An An Bı 5% 

B= , entonces las particio- 

Ay An] B, ġ 

nes de A y B están conformadas para la multiplicación por 

bloques. 


» sia=| 


a) Si Aj, A2, Bı y B2 son matrices de n x n, A = P | y 
2 


B=[B, B»], entonces el producto BA está definido, pero AB 
no lo está. 


b) S A= [z e] entonces la transpuesta de A es 
PT QT 
E K ST 
B 0 
Sea A = o ch donde B y C son cuadradas. Demuestre 


que A es invertible si y solo si B y C son invertibles. 


Demuestre que el bloque de matriz triangular superior A en el 
ejemplo 5 es invertible si y solo si tanto A4; como A% son inver- 
tibles. [Sugerencia: Si A11 y Az son invertibles, la fórmula para 
A7!, que se dio en el ejemplo 5, en realidad funciona como la 
inversa de A]. Este hecho de A es una parte importante de varios 
algoritmos de computadora que estiman valores propios de ma- 
trices. Los valores propios se analizan en el capítulo 5. 


Cuando se lanza una sonda espacial, es necesario hacer algu- 
nas correcciones para colocar la nave en una trayectoria exacta. 
La radio telemetría proporciona un flujo de vectores, Xj,..., Xp, 
que arrojan información en diferentes momentos sobre cómo 
se compara la posición de la sonda con la trayectoria prevista. 
Sea X; la matriz [Xx] +: Xg]. La matriz G; = XX se calcula 
conforme se analizan los datos del radar. Cuando llega Xg+1, se 
debe calcular un nuevo Gz+1. Como los vectores de datos llegan 
a alta velocidad, la carga computacional podría ser grande. Pero 
la multiplicación de la matriz particionada ayuda muchísimo. 
Calcule las expansiones columna-fila de G; y Grx+1, y describa 
lo que se debe calcular para actualizar G, a la forma G;+1. 
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La sonda Galileo fue lanzada el 18 de octubre 
de 1989 y llegó cerca de Júpiter a principios de 
diciembre de 1995. 


An Ap 
Az Az 


S = An — 424,41» se llama complemento de Schur de A;. 
Por otra parte, si A22 es invertible, la matriz A11 — A12A 21 se 
llama complemento de Schur de A22. Suponga que A1; es in- 
vertible. Encuentre X y Y tal que 


f: Tek a E J D 

Ax A X I 0 Sj||O / 

17. Suponga que la matriz por bloques A del lado izquierdo de (7) 
y Aıı son invertibles. Demuestre que el complemento de Schur 
S de Aj, es invertible. [Sugerencia: Los factores externos lo- 
calizados en el lado derecho de (7) siempre son invertibles. 
Compruebe esto]. Cuando A y Aj, son ambas invertibles, (7) 


conduce a una fórmula para A”, utilizando S7*, Aj y las otras 
entradas de A. 


16. Sea A = | | Si Aıı es invertible, entonces la matriz 


18. Sea X una matriz de datos de m x n tal que XTX es invertible, y 
sea M = Ln — XA X) 1x7, Añada una columna xy a los datos 
y forme 


W=I[X xo]. 


Calcule W"W. La entrada (1, 1) es XTX. Demuestre que el com- 
plemento de Schur (ejercicio 16) de X7X se puede escribir en la 
forma xi Mxo. Es posible demostrar que la cantidad ag Mx)! 
es la entrada (2, 2) de (WTW)~!. Esta entrada tiene una interpre- 
tación estadística útil, a la luz de las hipótesis adecuadas. 


En el estudio de ingeniería de control de sistemas físicos, un con- 
junto estándar de ecuaciones diferenciales se transforma en el si- 
guiente sistema de ecuaciones lineales por medio de transformadas 
de Laplace: 


e leli] o 


donde A es de n x n, B es de n x m, C es de m x n, y s es una variable. 
El vector u en R” es la “entrada” del sistema, y en R” es la “salida” 
del sistema, y x en R” es el vector de “estado”. (En realidad, los 
vectores x, u y y son funciones de s, pero esto no afecta los cálculos 
algebraicos de los ejercicios 19 y 20). 


19. 


20. 


21. 


22. 


23. 


24. 


Suponga que A — sl, es invertible y considere la ecuación (8) 
como un sistema de dos ecuaciones matriciales. Resuelva la 
ecuación superior para x y sustitúyala en la ecuación inferior. 
El resultado es una ecuación de la forma W(s)u = y, donde W(s) 
es una matriz que depende de s. W(s) se denomina función de 
transferencia del sistema porque transforma la entrada u en la 
salida y. Encuentre W(s) y describa cómo está relacionada con 
el sistema de matriz particionada del miembro izquierdo de (8). 
Véase el ejercicio 16. 


Suponga que la función de transferencia W(s) del ejercicio 19 
es invertible para alguna s. Es posible demostrar que la fun- 
ción de transferencia inversa W(s)”!, que transforma salidas en 
entradas, es el complemento de Schur de A — BC — sl, para 
la matriz que se presenta a continuación. Encuentre este com- 
plemento de Schur. Véase el ejercicio 16. 


A-BC-sí, B 
-C Im 


a) Compruebe que A? = / cuando A = | E a | 


b) Use matrices particionadas para demostrar que M? = I 


cuando 
1 0 0 
2 —1 0 0 
M 1 —1 0 
0 1 -—2 1 


Generalice la idea del ejercicio 21 al construir una matriz M 
A 0 0 
0 B 0 
C 0 D 
una matriz de 2 x 2 no nula. Muestre que su construcción 
funciona. 


de 6 x 6, M = tal que M? = I. Haga a C 


Use matrices particionadas para demostrar, por inducción, que 
el producto de dos matrices triangulares inferiores también 
es triangular inferior. [Sugerencia: Una matriz A; de (k + 1) x 
(k + 1) se puede escribir en la forma presentada a continua- 
ción, donde a es un escalar, v está en RY, y A es una matriz trian- 
gular inferior de k x k. [Véase la Guía de estudio para obtener 
ayuda con la inducción]. 


A == 
v A 
Use matrices particionadas para demostrar por inducción que 


para n = 2, 3,..., la matriz A de n x n que se presenta a conti- 
nuación es invertible y que B es su inversa. 


1 0 0 > 0 
1 1 0 0 

asi 1 ol, 
l 1l 1l 1 

o 0 0 

-1 1 0 0 

B= -1 1l 0 

0 -1 1 


25. 


26. 


Para el paso de inducción, suponga que A y B son matrices de 
(k + 1) x (k + 1), y particione A y B de una manera similar a 
la que se presenta en el ejercicio 23. 


Sin utilizar reducción por filas, encuentre la inversa de 


1 2 0 0 0 
3353 
A=j0 0 

0 8 

0 6 


[M] Para las operaciones de bloque, podría ser necesario intro- 
ducir o recurrir a submatrices de una matriz grande. Describa 
las funciones o los comandos de un programa de matrices que 
realice las siguientes tareas. Suponga que A es una matriz de 
20 x 30. 


a) Presente la submatriz de A de las filas 5 a 10 y de las colum- 
nas 15 a 20. 


b) Inserte una matriz B de 5 x 10 en una matriz A, comenzando 
en la fila 5 y la columna 10. 


Oooou 
oono 
4-00 


27. 
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c) Construya una matriz de 50 x 50 de la forma 


A 0 y . 
= E a| [Nota: Tal vez no sea necesario especi- 


ficar los bloques de ceros en C]. 


[M] Suponga que debido a restricciones de memoria o al tama- 
ño su programa de matrices no puede trabajar con matrices de 
más de 32 filas y 32 columnas, y suponga que algún proyecto 
requiere las matrices A y B de 50 x 50. Describa los comandos 
o las operaciones de su programa para matrices que realizan las 
siguientes tareas. 


a) Cálculo de A + B. 
b) Cálculo de AB. 


c) Resolución de Ax = b para algún vector b en R5, supo- 
niendo que A se pueda particionar en una matriz por blo- 
ques de 2 x 2 [4;;], con A11 una matriz invertible de 20 x 20, 
An una matriz invertible de 30 x 30, y A12 una matriz cero. 
[Sugerencia: Describa sistemas adecuados más pequeños 
que puedan resolverse sin usar matrices inversas]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Si la J es invertible, su inversa tiene la forma | K 


I O 
A I 


I 


W X 
Y Z| |AW+Y AX+Z 


X 
Y Z Í Compruebe que 


W X 


Así, W, X, Y, Z deben satisfacer W = I, X = 0, AW + Y = 0, y AX + Z = I. Como con- 
secuencia, Y = —A y Z = I. Por lo tanto, 


rE 


El producto en el orden inverso también es la identidad, de modo que la matriz de bloque 


; f ; I O sE z a i 
es invertible, y su inversa es la AI | (También podría recurrir al teorema de la matriz 


invertible). 
009 630 0 ME 
E 


xi E XTX, XTX o. 7 
X X2|= . Las particiones de X” y X se con- 


XX AEX 


forman de manera automática para la multiplicación por bloques, ya que las columnas de 
X" son las filas de X. Esta partición de XTX se usa en varios algoritmos de computadora 
para cálculos de matrices. 


2.5 | FACTORIZACIONES DE MATRICES 


Una factorización de una matriz A es una ecuación que expresa a A como un producto de 
dos o más matrices. Mientras que la multiplicación de matrices implica una síntesis de da- 
tos (combinando el efecto de dos o más transformaciones lineales en una sola matriz), la 
factorización de matrices es un análisis de datos. En el lenguaje de la ciencia computacio- 
nal, la expresión de A como un producto equivale a un procesamiento previo de los datos de 
A, organizando esos datos en dos o más partes cuyas estructuras son más útiles de algún 
modo, quizá por ser más accesibles para realizar cálculos. 
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Las factorizaciones de matrices y, después, las factorizaciones de transformaciones linea- 
les se presentarán en un gran número de secciones clave a lo largo de este libro. Esta sección 
se enfoca en una factorización que constituye el centro neurálgico de varios importantes pro- 
gramas de cómputo usados ampliamente en aplicaciones, como en el problema de la aeronave 
descrito en la introducción del capítulo. Algunas otras factorizaciones que se estudiarán des- 
pués, se presentan en los ejercicios. 


La factorización LU 


La factorización LU, descrita a continuación, está motivada por el muy frecuente problema 
industrial y de negocios que consiste en resolver una sucesión de ecuaciones, todas con la 
misma matriz de coeficientes: 


Ax=bj, Ax=b>, ..., Ax=b, (1) 


Véase el ejercicio 32, por ejemplo. También vea la sección 5.8, donde se usa el método de la 
potencia inversa para estimar los valores propios de una matriz resolviendo una secuencia de 
ecuaciones, como en (1), una a la vez. 

Cuando A es invertible, se podría calcular A7! y después calcular A7'b,, 47 !b,, y así 
sucesivamente. Sin embargo, resulta más eficiente resolver la primera ecuación en la se- 
cuencia (1) con reducción por filas y obtener una factorización LU de A al mismo tiempo. 
Después, las ecuaciones restantes de (1) se resuelven con la factorización LU. 

Primero, suponga que A es una matriz de m x n que se puede reducir por filas a su for- 
ma escalonada sin intercambios de fila. (Más adelante, se tratará el caso general). Entonces, 
A se puede escribir en la forma A = LU, donde L es una matriz triangular inferior de m x m 
con números 1 en la diagonal, y U es una forma escalonada de m x n de A. Por ejemplo, 
véase la figura 1. Una factorización de este tipo se llama factorización LU de A. La matriz 
L es invertible y se llama matriz triangular inferior unitaria. 


1 o o ola + + + + 
ae 1 o ollo n + + + 
T E 1 olo 0 0 m * 
E E * 110 0 0O 0 0 

L U 


FIGURA 1 Una factorización LU. 


Antes de estudiar la forma de construir L y U, es necesario examinar la razón de su uti- 
lidad. Cuando A = LU, la ecuación Ax = b se escribe como L(Ux) = b. Escribiendo y 
en lugar de Ux, se puede encontrar x resolviendo el par de ecuaciones 


Ly = b 0) 


Ux = y 


Primero se despeja y de Ly = b, y luego se resuelve Ux = y para obtener x. Véase la figura 2. 
Las dos ecuaciones resultan fáciles de resolver porque £ y U son triangulares. 


EJEMPLO 1 Es posible comprobar que 


3-7 2 2 1.0.0 0113-72 2 
3 5 1 0 a ı 0 ollo 2 -1 2 

A=| 6-4 o -5|5| 2-5 1 ollo oa 1l 54W 
-9 5-5 12 -3 8 3 illo o o0 
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Multiplicación 
por A 
Xo eb 
Multiplicación y Multiplicación 
por U por L 


FIGURA 2 Factorización del mapeo x > Ax. 


Use esta factorización LU de A para resolver Ax = b, donde b = 
11 
SOLUCIÓN La solución de Ly = b requiere únicamente de 6 multiplicaciones y 6 sumas, 


porque la aritmética ocurre solo en la columna 5. (En L, los ceros debajo de cada pivote se 
crean automáticamente con la elección de las operaciones de fila). 


1 0 0 0 -9 1 0 0 0-9 
-1 1 0 0 5 0 1 0 0 4 

[L b] mo PIP os a a 
E 0 0 0 1 1 


Entonces, para Ux = y, la fase “regresiva” de la reducción por filas requiere de 4 divi- 
siones, 6 multiplicaciones y 6 sumas. (Por ejemplo, para producir ceros en la columna 4 de 
[U y] se requieren una división en la fila 4 y tres pares de multiplicación-suma para sumar 
múltiplos de la fila 4 a las filas de arriba). 


E A 1 0 0 0 3 3 
[u y] — 0-2 -1 24 0. 1.0.0 4 y 4 
0 0-1 1.5 0.0 1 0—6 —6 
0. 0 0-1 1 0. 0 0 1-1 -1 


Para encontrar x se requieren 28 operaciones aritméticas o “flops” (operaciones de pun- 
to flotante), excluyendo el costo de encontrar L y U. En contraste, la reducción por filas de 
[A bla[/ x] requiere de 62 operaciones. A 


La eficiencia computacional de la factorización LU depende de que se conozcan L 
y U. El siguiente algoritmo muestra que la reducción por filas de A a su forma escalonada 
U equivale a una factorización LU, porque produce L prácticamente sin trabajo extra. Des- 
pués de la primera reducción por filas, L y U se obtienen al resolver ecuaciones adicionales 
cuya matriz de coeficientes es A. 


Un algoritmo de factorización LU 


Suponga que Á se puede reducir a una forma escalonada U utilizando solo remplazos de filas 
que suman un múltiplo de una fila a otra situada debajo de esta. En este caso, existen matrices 
elementales triangulares inferiores unitarias E,..., E, tales que 


Ep“ E¡A =U (3) 
Luego, 
A = (Ep © E lU= LU 
donde 


L= (E, + Ey! (4) 
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Es posible demostrar que los productos y las inversas de las matrices triangulares inferiores 
unitarias también son triangulares inferiores unitarias. (Por ejemplo, véase el ejercicio 19). 


Así, L es triangular inferior unitaria. 
Observe que las operaciones de fila en la ecuación (3), que reducen A a U, también re- 


ducen la £ en la ecuación (4) a Z, debido a que E, *** EL = (E, *** ENE, *** EN”! = 1. Esta 
observación es la clave para construir L. 


ALGORITMO PARA UNA FACTORIZACIÓN LU 


1. Sies posible, reduzca A a una forma escalonada U con una sucesión de operaciones 
de remplazo de filas. 

2. Coloque las entradas de L de tal manera que la misma secuencia de operaciones de 
fila reduzca L a I. 


El paso 1 no siempre es posible, pero cuando lo es, el argumento anterior indica que 
existe una factorización LU. En el ejemplo 2 se mostrará cómo implementar el paso 2. Por 
construcción, L satisfará 


(E, EYL=1 


donde se usan las mismas £E',..., E, que en la ecuación (3). Así, L será invertible, de acuerdo 
con el teorema de la matriz invertible, con (Ep = E1) = L.A partir de (3), L'A = U, y 
A = LU. Por lo tanto, el paso 2 producirá una £ aceptable. 


EJEMPLO 2 Encuentre una factorización LU de 


2 4-1 5-2 
4-5 3-8 1 
2 -5-4 1 8 
6 0 7-3 1 


A= 


SOLUCIÓN Como A tiene cuatro filas, L debe ser de 4 x 4. La primera columna de L es la 
primera columna de A dividida entre la entrada pivote superior: 


1 0 0 Ọ 

—2 1 0 0 

He 1 1 0 
—3 1 


Compare las primeras columnas de A y L. Las operaciones de fila que crearon ceros en la 
primera columna de A también crearán ceros en la primera columna de L. Para lograr que 
esta misma correspondencia de operaciones de fila sea válida para el resto de L, se examina 
una reducción por filas de A a una forma escalonada U. Es decir, se resaltan las entradas en 
cada una de las matrices que se utilizan para determinar la secuencia de las operaciones de 
fila que transforman A en U. [Véase las entradas resaltadas en la ecuación (5)]. 


J 4-1 5-2 2 A E 
5 3-38 1 o E 1 2-3 
A=] 2325-4 1 g|% o -9 -3 -4 10 14% 6) 
A 0 7-3 1 0 12 4 12 -s 
2 4-1 52 2 4-1 52 
0o 3 e T Es 0 3 1 2—3 
~A&=lo o o0 @ ıl~lo o o 2 q >? 
0 0 0 4 7 0 0 0 0 5 
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Las entradas resaltadas de la ecuación (5) determinan la reducción por filas de A a U. En cada 
columna pivote, divida las entradas resaltadas entre el pivote y coloque el resultado en L: 


2 
—4 3 
2 =9 ||2 
—6 12 E [5] 
=2 do EL S 
y 4 4 y 
1 1.0.0.0 
-2 1 —2 1 0 0 
1 -3 1 a 1 0 
—3 4 2 1 =3 4-2 61 
Un cálculo fácil comprueba que estas L y U satisfacen que LU = A. E 


En el trabajo práctico, casi siempre son necesarios los intercambios de fila, porque se usa 
el pivoteo parcial para lograr una precisión alta. (Recuerde que este procedimiento selecciona, 
entre las posibles opciones de pivote, una entrada en la columna que tenga el mayor valor ab- 
soluto). Para manejar los intercambios de fila, la factorización LU anterior se puede modificar 
con facilidad para producir una L que sea triangular inferior permutada, en el sentido de que 
un reordenamiento (llamado permutación) de las filas de L puede hacer que L sea triangular 
inferior (unitaria). La factorización LU permutada resultante resuelve Ax = b en la misma 
forma que antes, excepto que la reducción de [L b]a[/ y] es consecuencia del orden de 
los pivotes de £ de izquierda a derecha, empezando con el pivote de la primera columna. Una 
referencia a una “factorización LU” normalmente incluye la posibilidad de que £ pueda ser 
triangular inferior permutada. Para mayores detalles, véase la Guía de estudio. 


NOTAS NUMÉRICAS 





Los siguientes conteos de operaciones corresponden a una matriz densa A de n x n 
(con la mayoría de sus entradas distintas de cero), donde n es moderadamente grande, 
por ejemplo, n = 30.! 


1. El cálculo de una factorización LU de A requiere 2n*/3 flops (aproximadamente lo 
mismo que reducir por filas [A b]), mientras que encontrar A”! requiere alrededor 
de 2n? flops. 


Resolver Ly = b y Ux = y requiere alrededor de 2n? flops, ya que cualquier sis- 
tema triangular n x n se puede resolver en aproximadamente n? flops. 


La multiplicación de b por A”! también requiere cerca de 2n? flops, pero el resul- 
tado quizá no sea tan preciso como el obtenido a partir de L y U (debido al error 
de redondeo cuando se calculan tanto a A7! como a A7!b). 


Si A es dispersa (la mayoría de sus entradas son cero), entonces L y U podrían ser 
dispersas también, pero es probable que A”! sea densa. En este caso, una solución 
de Ax = b con una factorización LU es mucho más rápida que usar A”!, Véase el 
ejercicio 31. 


Factorización de matrices en ingeniería eléctrica 


La factorización de matrices está íntimamente relacionada con el problema de construir una 
red eléctrica de propiedades específicas. El análisis que se presenta a continuación permite 
vislumbrar la relación entre factorización y diseño de circuitos. 


l Véase la sección 3.8 de Applied Linear Algebra, 3a. ed., de Ben Noble y James W. Daniel (Englewood Cliffs, NJ: 
Prentice-Hall, 1988). Recuerde que para nuestros propósitos, un flop es +, —,x 0 +. 
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Suponga que el cuadro de la figura 3 representa algún tipo de circuito eléctrico, con una 
i a . i a v 
entrada y una salida. El voltaje y la corriente de entrada se registran mediante | f | (con el 
1 
voltaje v en volts y la corriente i en amperes), y el voltaje y la corriente de salida se registran 
v2 : o, | UL v2 . . ; 
como | D | Con frecuencia, la transformación | i | > | al es lineal. Es decir, existe una 


matriz A, que se llama matriz de transferencia, tal que 


1 A a zi l, 
— —>—o 

l I 
terminales 1 circuito ı $ terminales 
de entrada 1 ! eléctrico ! 2 de salida 

I I 

1 1 

ERA J 


FIGURA 3 Un circuito con terminales de entrada 
y salida. 


En la figura 4 se muestra una red en escalera, donde dos circuitos (podría haber más) 
están conectados en serie, de modo que la salida de un circuito sea la entrada del siguiente 
circuito. El circuito de la izquierda en la figura 4 es un circuito en serie, con resistencia R¡ 
(en ohms). 





Un circuito en serie Un circuito con derivación 


FIGURA 4 Una red en escalera. 


El circuito de la derecha en la figura 4 es un circuito con derivación, con resistencia R,. Con 
base en la ley de Ohm y las leyes de Kirchhoff, es posible demostrar que las matrices de trans- 
ferencia de los circuitos en serie y con derivación, respectivamente, son, 


E =] 7 Ei `| 


Matriz de transferencia Matriz de transferencia 
del circuito en serie del circuito con derivación 


EJEMPLO 3 


a) Calcule la matriz de transferencia para la red en escalera de la figura 4. 


8 
b) Diseñe una red en escalera cuya matriz es | Ls wS | 


SOLUCIÓN 


a) Sean A; y A las matrices de transferencia de los circuitos en serie y con derivación, res- 
pectivamente. Entonces, un vector de entrada x se transforma primero en Ax y luego en 
A>2(A1x). La conexión en serie de los circuitos corresponde a la composición de transfor- 
maciones lineales, y la matriz de transferencia de la red en escalera es (observe el orden) 


B 1 0O|[1 —R1 | 1 =R; 
mi =| iir ille TE? Le RR] 2 


b) Para factorizar la matriz | 1 


5 
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| en el producto de matrices de transferencia, como 


en la ecuación (6), se buscan las R¡ y R) de la figura 4 que satisfagan 


= Ry 
1+ Rı/R2 


¡Sl 


1 —8 
—.5 5 


De las entradas (1, 2), se tiene que Rı = 8 ohms, y de las entradas (2, 1), 1/R = .5 ohm 
y Rə = 1/.5 = 2 ohms. Con estos valores, la red de la figura 4 tiene la matriz de trans- 


ferencia deseada. 


Una matriz de transferencia de red resume el comportamiento de entrada y salida (las 
especificaciones de diseño) de la red, sin referencia a los circuitos internos. Para construir fí- 
sicamente una red con propiedades específicas, un ingeniero determina al principio si es posi- 
ble construir (o realizar) dicha red. Después, trata de factorizar la matriz de transferencia para 
obtener matrices correspondientes a circuitos más pequeños que quizá ya fueron fabricados y 
estén listos para ensamblarse. En el caso común de la corriente alterna, las entradas de la ma- 
triz de transferencia normalmente son funciones con valores complejos. (Véase los ejercicios 
19 y 20 de la sección 2.4 y el ejemplo 2 de la sección 3.3). Un problema estándar consiste en 
encontrar una realización mínima que use el menor número de componentes eléctricos. 


PROBLEMA DE PRÁCTICA 


Encuentre una factorización LU de A = 


ANON 


—6 


-2 3 
=5 8 
—3 9 |. [Nota: Resultará que A 
2 -1 
3 4 


tiene solamente tres columnas pivote, de manera que el método del ejemplo 2 solo produce 
las tres primeras columnas de L. Las dos columnas restantes de L provienen de Z5]. 


2.5 EJERCICIOS 


En los ejercicios 1 a 6, resuelva la ecuación Ax = b usando la fac- 
torización LU dada para A. En los ejercicios 1 y 2, resuelva también 


Ax = b por reducción ordinaria de columnas. 


3 -7 -2 -7 
1. 4A=|-3 5 1]|,b= 5 
6 —4 0 2 
1 0 0 3 -7 -2 
A=|-l 1 0 0 -2 -—1 
2 -=5 1 0 0 —1 
2 —6 4 2 
2. A= | -4 8 0 |,b= | —4 
0 —4 6 6 
1 0 0 2 —6 4 
A=|-2 1 0 0 —4 8 
0 1 1 0 0 -2 
2 —4 2 6 
3. A= | —4 5 2|, b=]|0 
6 —9 1 6 


> 


1 
A=|- 
3 

1 
A=|1 
3 

1 
A=|1 
3 

1 

3 

A= l 
—3 

| 1 

3 

az -1 
=3 


RhOonro 


2 —4 2 
0-3 6 
0 o0 1 

0 

,b= | —5 

7 

1-1 2 
0 -2 -I 
0 0 —6 
z3 1 
—9 6 

pao 

2 3 


0 I :=2: :=2: :=Y 
0 03 6 0 


0 0 0 2 4 
1 0 0 0 1I 
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1 3 2 0 1 
D a e L -2 
A 36 P?5]| 
—5 -3 -8 49 2 
1 0 0 oļi 3 2 0 
qa 2 1 0 ojjo 3 0 2 
3 -3 ollo o-2 0 
-5 4-1 1|lo 0 0 1 


Encuentre una factorización LU de las matrices de los ejercicios 7 a 
16 (con £ triangular inferior unitaria). Observe que MATLAB gene- 
ralmente producirá una factorización LU permutada porque utiliza 
pivoteo parcial para lograr exactitud numérica. 


7. 


11. 


13. 


15. 


17. 


18. 
19. 


20. 


21. 


[5 <) los, 








T3 1 2 -5 0 4 
—9 0 —4 10. | 10 2 —5 
| 9 9 14 [ 10 10 16 
[3 7 2 p (37 2 
6 19 4 12. 4 13 9 
| -3 -2 3 | -6 5 4 
[1 3 -5 -3 1 3 1 5 
-1 -5 8 4 já 5 20 6 31 
4 2-5 -7 ela ey 
| -2 -4 7 5 | -1 DY 
PT. 2-3 4 
T2 0 5 2 -4 8 -7 
6 3-13 33 16. 6 -5 14 
| 4 9 16 17 —6 9-12 
L 8 -6 19 


Cuando A es invertible, MATLAB encuentra A”! al factorizar 
A = LU (donde L puede ser triangular inferior permutada), in- 
virtiendo L y U, y luego calculando U7'L”*. Use este método 
para calcular la inversa de A en el ejercicio 2. (Aplique el algo- 
ritmo de la sección 2.2 a L y a U). 


Encuentre A”! como en el ejercicio 17, usando A del ejercicio 3. 


Sea A una matriz de n x n triangular inferior con entradas di- 
ferentes de cero en la diagonal. Demuestre que A es invertible 
y AT! es triangular inferior. [Sugerencia: Explique por qué A 
puede convertirse en 7 usando solo remplazos de filas y esca- 
lamientos. (¿Dónde están los pivotes?). También, explique por 
qué las operaciones de fila que reducen A a / transforman a 7 
en una matriz triangular inferior]. 


Sea A = LU una factorización LU. Explique por qué A se puede 
reducir por filas a U utilizando solamente operaciones de rem- 
plazo. (Este hecho es el recíproco de lo que se demostró en el 
libro). 


Suponga que A = BC, donde B es invertible. Demuestre que 
cualquier sucesión de operaciones de fila que reduzca B a I tam- 
bién reduce A a C. Lo contrario no es cierto, puesto que la ma- 
triz cero puede factorizarse como 0 = B - 0. 


Los ejercicios 22 a 26 ofrecen una visualización de ciertas factori- 
zaciones de matriz ampliamente utilizadas, algunas de las cuales se 
analizan posteriormente en el libro. 


22. 


23. 


24. 


25. 


26. 


27. 


28. 


29. 


(Factorización LU reducida). Con A como en el problema 
de práctica, encuentre una matriz B de 5 x 3 y una matriz C de 
3 x 4 tales que A = BC. Generalice esta idea para el caso donde 
A esm x n, A = LU, y U tiene solamente tres filas diferentes 
de cero. 


(Factorización de rango). Suponga que una matriz A de m x n 
admite una factorización A = CD, donde C es de m x 4 y D es 
de4 xn. 


a) Demuestre que A es la suma de cuatro productos exteriores. 
(Véase la sección 2.4). 

b) Sea m = 400 y n = 100. Explique por qué un programador 
de computadoras preferiría almacenar los datos de A en for- 
ma de dos matrices C y D. 


(Factorización QR). Suponga que A = QR, donde Q y R son 
n x n, R es invertible y triangular superior, y Q tiene la pro- 
piedad de que QTQ = I. Demuestre que para cada b en R”, la 
ecuación Ax = b tiene una solución única. ¿Qué cálculos con 
Q y R producirán la solución? 


(Descomposición en valores singulares). Suponga que A = 
UDV”, donde U y V son matrices de n x n con la propiedad de 
que UTU = I y VTV = I, y donde D es una matriz diagonal con 
números positivos d-,,..., dr, en la diagonal. Demuestre que A es 
invertible y encuentre una fórmula para A”. 


(Factorización espectral). Suponga que una matriz A de 3 x 3 
admite una factorización como A = PDP”", donde P es alguna 
matriz invertible de 3 x 3, y D es la matriz diagonal 


2 0 0 
D=|0 3 0 
0 0. 1 


Muestre que esta factorización es útil cuando se calculan po- 
tencias grandes de A. Encuentre fórmulas relativamente senci- 
llas para A?, A? y AF (k es un entero positivo), usando P y las 
entradas en D. 


Diseñe dos redes en escalera diferentes con salida de 9 volts y 
4 amperes cuando la entrada sea de 12 volts y 6 amperes. 


Demuestre que si tres circuitos con derivación (cuyas resisten- 
cias son R4, R2, R3) se conectan en serie, la red resultante tiene 
la misma matriz de transferencia que un único circuito con de- 
rivación. Encuentre una fórmula para la resistencia que haya en 
ese circuito. 


a) Encuentre la matriz de transferencia de la red que se ilustra 
en la figura. 





3 -12 
—1/3 5/3 
cuya matriz de transferencia sea A, encontrando una factori- 
zación matricial adecuada de A. 


b) Sea a=| 


| Diseñe una red en escalera, 


30. Encuentre una factorización diferente de la matriz de transfe- 


31. 


rencia A del ejercicio 29 y, a partir de ello, diseñe una red en 
escalera diferente cuya matriz de transferencia sea A. 


[M] Considere la placa térmica en la siguiente figura (consulte 
el ejercicio 33 en la sección 1.1). 





e O O A O A 


$ NU, 201 











102 10° 10% 10° 
La solución al problema de flujo de calor en estado estable para la 


placa de la figura se aproxima al resolver la ecuación Ax = b, 
donde b = (5, 15, 0, 10, O, 10, 20, 30) y 


4 -1 -—1 
= 4 0 -l 
-1 0 4 -l -l 
-1 -1 4 0 -I 
-1 0 4 -l -l 
—1 -1 4 0 -l 


-1 0 4-1 
-1 -1 4 


Las entradas faltantes en A son ceros. Las entradas de A dife- 
rentes de cero se encuentran dentro de una banda a lo largo de 
la diagonal principal. Tales matrices de banda se presentan en 
diversas aplicaciones, y con frecuencia son extremadamente 
grandes (con miles de filas y columnas, pero con bandas relati- 
vamente angostas). 


0 
| 


a) Utilice el método del ejemplo 2 para construir una factori- 
zación LU de A, y observe que ambos factores son matrices 
de banda (con dos diagonales diferentes de cero abajo o arri- 
ba de la diagonal principal). Calcule LU — A para compro- 
bar su trabajo. 


32. 
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b) Use la factorización LU para resolver Ax = b. 


c) Obtenga A”! y observe que A”! es una matriz densa sin 
estructura de banda. Cuando A es grande, L y U se pueden 
almacenar en mucho menos espacio que A”*. Este hecho 
es otra razón para preferir la factorización LU de A en lu- 
gar de A7!, 


[M] La matriz de banda A que se ilustra a continuación pue- 
de servir para calcular la conducción inestable de calor en una 
varilla para la cual las temperaturas en los puntos pj,..., Pa 
cambian con el tiempo.? 


Ax Ax Ax Ax Ax 
a ) 
Pi P2 P3 P4 





La constante C de la matriz depende de la naturaleza física de la 
varilla, de la distancia Ax entre los puntos de la varilla, y del 
tiempo Af que transcurre entre mediciones sucesivas de tem- 
peratura. Suponga que para k = 0, 1, 2,..., un vector t en R4 
lista las temperaturas en el tiempo kAt. Si ambos extremos de la 
varilla se mantienen a 0*, entonces los vectores de temperatura 
satisfacen la ecuación At;+1 = tx (k = 0, 1,...), donde 


(1+20) -C 

¿al + Ale) “E 

A -C EDEN: -C 
-C  (1+20) 


a) Encuentre la factorización LU de A cuando C = 1. Una ma- 
triz como A con tres diagonales diferentes de cero se deno- 
mina matriz tridiagonal. Los factores L y U son matrices 
bidiagonales. 


Suponga que C = 1 y tọ = (10, 15, 15, 10). Use la factori- 
zación LU de A para encontrar las distribuciones de tempe- 
ratura tı, t2, t3 y t4. 


b 


= 


2 Véase Biswa N. Datta, Numerical Linear Algebra and Applications (Pacific 
Grove, CA: Brooks/Cole, 1994), pp. 200-201. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


A= 


=6 


2 


0 
0 
0 
0 


0 
0 
0 


—4 
-9 
7 
22 

3 


—4 
3 


RS 2-4 2 3 
=5 8 O MS 1 —1 
3 9|-=|0-3-1 6 
—2 -l1 0.6 2 -7 
3 4 0 —9 -3 13 
=2 3 E E y3 
1 -—1 0. 3 1 -—1 
0 5S|=|0 0 O 5|=U 
0 == 0.0 0. 0 
0 10 0.0 0. 0 


Divida las entradas de cada columna resaltada por el pivote en la parte superior. Las co- 
lumnas resultantes forman las tres primeras columnas de la mitad inferior de L. Esto basta 
para hacer que la reducción por filas de L a I corresponda a la reducción de A a U. Use las dos 
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últimas columnas de Z; para hacer que L sea triangular inferior unitaria. 


2 

6 3 

2 —3 e] 

4 6 =5 

—6 —9 10 

=2 =3 =5 

y y y 

1 1 0o 0 0 0 
3 1 3 1 0 0 0 
1 —1 1 P E 1 —1 1 0 0 
2 —1 2 2 -1 1 0 
-3 -3 2 -3 —3 2 0 1 


2.6 | EL MODELO DE LEONTIEF DE ENTRADA Y SALIDA 


El álgebra lineal desempeñó un papel fundamental en el trabajo de Wassily Leontief gana- 
dor del Premio Nobel, como se mencionó al principio del capítulo 1. El modelo económico 
descrito en esta sección es la base de modelos más complejos usados en muchas partes del 


mundo. 


Suponga que la economía de una nación se divide en n sectores que producen bienes o 
servicios, y sea x un vector de producción en RR” que lista la producción de cada sector en un 
año. También, suponga que otra parte de la economía (que se llama sector abierto) no produce 
bienes ni servicios, sino que solamente los consume, y sea d un vector de demanda final (o 
cuenta de demandas finales) que lista los valores de los bienes y servicios demandados a los 
diversos sectores por la parte no productiva de la economía. El vector d puede representar la 
demanda del consumidor, el consumo del gobierno, el superávit de producción, las exporta- 


ciones u otras demandas externas. 


Conforme los diversos sectores elaboran bienes para satisfacer la demanda del consumi- 
dor, los productores crean por sí mismos una demanda intermedia adicional de bienes que 
necesitan como insumos para su propia producción. Las interrelaciones de los sectores son 
muy complejas, y la conexión entre la demanda final y la producción es poco clara. Leontief 
se preguntó si hay un nivel de producción x tal que las cantidades producidas (o “suministra- 
das”) equilibran exactamente la demanda total de esa producción, de modo que 


cantidad demanda 
; demanda 
producida p = 4. sape final 
2 intermedia d 


La suposición básica del modelo de Leontief de entrada y salida es que, para cada sector, 
hay un vector de consumo unitario en R” que lista los insumos necesarios por unidad de 
producción del sector. Todas las unidades de entrada y salida se miden en millones de dóla- 
res, y no en cantidades como toneladas o fanegas. (Los precios de los bienes y servicios se 


mantienen constantes). 


Como un ejemplo sencillo, suponga que la economía consiste en tres sectores —manu- 
factura, agricultura y servicios—, con los vectores unitarios de consumo Cy, C, y €3 que se 


muestran en la siguiente tabla. 
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Insumos consumidos por unidad de producción 








Comprados por: Manufactura Agricultura Servicios 
Manufactura .50 .40 .20 
Agricultura .20 .30 .10 
Servicios .10 .10 .30 

1 î 1 

cı c2 c3 


EJEMPLO 1 ¿Qué cantidades consumirá el sector de manufactura si decide producir 100 
unidades? 


SOLUCIÓN Calcule 


.50 50 
100c; = 100| .20 | = | 20 
.10 10 


Para producir 100 unidades, manufactura ordenará (es decir, “demandará”) y consumirá 50 
unidades de otras partes del sector de manufactura, 20 unidades de agricultura y 10 unidades 
de servicios. E 


Si manufactura decide producir xı unidades, entonces xı€ı representa las demandas in- 
termedias de manufactura, porque las cantidades de x,Cc, se consumirán en el proceso de crea- 
ción de las xı unidades de producción. De la misma forma, si x2 y x3 denotan las producciones 
planeadas de los sectores de agricultura y servicios, x2C2 y x3€3, listan las demandas interme- 
dias correspondientes. La demanda intermedia total de los tres sectores está dada por 


[demanda intermedia) = x¡C¡ + x2C2 + X3C3 
= Cx (2) 


donde C es la matriz de consumo [c, €c c3], a saber, 


50 .40 .20 
C=]|.20 .30 10 (3) 
10 .10 30 


Las ecuaciones (1) y (2) producen el modelo de Leontief. 


EL MODELO DE LEONTIEF DE ENTRADA Y SALIDA, O ECUACIÓN DE PRODUCCIÓN 
X = Cx + d (4) 


Cantidad Demanda Demanda 
producida intermedia final 


La ecuación (4) también se puede escribir como /x — Cx = d, o 
1-Chx=d (5) 
EJEMPLO 2 Considere la economía cuya matriz de consumo está dada por (3). Suponga 


que la demanda final es de 50 unidades para manufactura, 30 unidades para agricultura, y 20 
unidades para servicios. Encuentre el nivel de producción x que satisfará esta demanda. 
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TEOREMA 11 


SOLUCIÓN La matriz de coeficientes en (5) es 


1 0 0 A ==. 2 
L=cC=E 0. T-000 = a ¿1 138 | =2::7=1 
0 1 1 1 3 SPS 


Para resolver (5), reduzca por filas la matriz aumentada 


2 00) 5 —4 —2 500 1 0 0 226 
—.2 7—1 3U00| =|-2 7-1 300|=--«=|0 1 0 119 
=.1=.1 .7 20 -=1 -1 7 200 0. 0 1 78 


La última columna se redondea a la unidad más cercana. El área de manufactura debe pro- 
ducir aproximadamente 226 unidades, agricultura 119 unidades, y servicios únicamente 78 
unidades. E 


Si la matriz 7 — C es invertible, entonces se puede aplicar el teorema 5 de la sección 2.2 
con A remplazada por (I — C), y a partir de la ecuación (I — C)x = d se obtiene x = (I — 
C) !d. El siguiente teorema indica que, en la mayoría de los casos prácticos, 7 — C es inver- 
tible y el vector de producción x es económicamente factible, en el sentido de que las entradas 
de x son no negativas. 

En el teorema, el término suma de columna denota la suma de las entradas en una co- 
lumna de una matriz. En circunstancias ordinarias, las sumas de columna de una matriz de 
consumo son menores que 1 porque un sector debería requerir menos de una unidad de insu- 
mos para generar una unidad de producción. 


Sea C la matriz de consumo de una economía, y sea d la demanda final. Si C y d tie- 
nen entradas no negativas, y si cada suma de columna de C es menor que uno, entonces 
(1 — C) | existe y el vector de producción 


x= (1- Cid 
tiene entradas no negativas y es la solución única de 


x=Cx>+d 


El siguiente análisis sugerirá por qué el teorema es cierto, y conducirá a una nueva ma- 
nera de calcular (1 — C)!. 


Una fórmula para (1 — C)71 


Imagine que la demanda representada por d se propone a las distintas industrias al inicio del 
año, y que estas responden estableciendo sus niveles de producción en x = d, lo cual satisfará 
exactamente la demanda final. Conforme las industrias se preparan para producir d, emiten 
órdenes solicitando materia prima y otros insumos. Esto crea una demanda intermedia de 
insumos de Cd. 

Para satisfacer la demanda adicional de Cd, las industrias necesitarán como insumos 
adicionales las cantidades de C(Cd) = C?d. Desde luego, esto crea una segunda ronda de 
demanda intermedia, y cuando las industrias deciden producir aún más para satisfacer esta 
nueva demanda, se genera una tercera ronda de demanda, a saber, C(C 2d) = Cód, y así su- 
cesivamente. 

En teoría, este proceso podría continuar de manera indefinida, aunque en la vida real no 
ocurriría en una sucesión tan rígida de acontecimientos. Podemos elaborar un diagrama de 
esta situación hipotética de la siguiente forma: 
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Demanda que debe Insumos necesarios para 





satisfacerse satisfacer esta demanda 
Demanda final d Cd 
Demanda intermedia 
la. ronda Cd C(Cd) = C’°d 
2a. ronda cod C(C?d) = Cód 
3a. ronda Cód C(Cód) = Ctd 


El nivel de producción x que satisfará toda esta demanda es 
x=d+Cd+C’d+C°’d+--- 
=(1+4C0+C?+C*+--)d (6) 
Para que la ecuación (6) tenga sentido, considere la siguiente identidad algebraica: 
(= CI+ C+ CÊ?+ -e + C”) =- C”! (7) 


Es posible demostrar que si las sumas de columna en C son todas menores que 1, entonces 
1 — C es invertible, C™” se aproxima a la matriz cero cuando m crece de manera arbitraria, 
e I — C™+! — I, (Esto es análogo al hecho de que si un número positivo £ es menor que 1, 
entonces t” — 0 conforme m aumenta). Con base en la ecuación (7), se escribe 


O C C 
cuando las sumas de columna de C son menores que 1. (8) 


La aproximación en (8) significa que el miembro derecho puede acercarse a (1 — C)”! tanto 
como se desee al hacer a m suficientemente grande. 

En los modelos de entrada y salida reales, las potencias de la matriz de consumo se 
aproximan a la matriz cero con cierta rapidez. Así, (8) realmente ofrece una manera práctica 
de calcular (1 — C)”?. De la misma forma, para cualquier d, los vectores Cd se aproximan 
al vector cero rápidamente, y (6) es una manera práctica de resolver (1 — C)x = d. Si las 
entradas de C y d son no negativas, entonces (6) indica que las entradas de x también son no 
negativas. 


Importancia económica de las entradas de (I — C)71 


Las entradas de (7 — C)~! son significativas porque pueden servir para predecir cómo tendrá 
que cambiar la producción x conforme cambie la demanda final d. De hecho, las entradas de 
la columna ¡ de (1 — C)7! son las cantidades aumentadas que los diversos sectores ten- 
drán que producir para satisfacer un aumento de 1 unidad en la demanda final de producción 
del sector j. Véase el ejercicio 8. 


NOTA NUMÉRICA 





En cualquier problema de aplicación (no solo en economía), una ecuación Ax = b se 
puede escribir siempre como (1 — Cjx = b, con C = [ — A. Si el sistema es grande y 
disperso (con cero en la mayoría de sus entradas), es posible que las sumas de colum- 


na de los valores absolutos en C sean menores que 1. En este caso, C” —> 0. Si C” 
tiende a cero con la suficiente rapidez, (6) y (8) representarán fórmulas prácticas para 
resolver Ax = b y encontrar A”. 
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2. 


PROBLEMA DE PRÁCTICA 


Suponga que una economía tiene dos sectores: bienes y servicios. Una unidad de producción 
de bienes requiere insumos de .2 unidades de bienes y .5 unidades de servicios. Una unidad de 
producción de servicios requiere insumos de .4 unidades de bienes y .3 unidades de servicios. 
Existe una demanda final de 20 unidades de bienes y 30 unidades de servicios. Implemente el 
modelo de Leontief de entrada y salida para esta situación. 


6 EJERCICIOS 


Los ejercicios 1 a 4 se refieren a una economía dividida en tres sec- 
tores: manufactura, agricultura y servicios. Por cada unidad de pro- 
ducción, manufactura requiere de .10 unidades de otras compañías 
pertenecientes a ese mismo sector, de .30 unidades del sector agricul- 
tura y de .30 unidades de servicios. Por cada unidad de producción, 
agricultura usa .20 unidades de su propia producción, .60 unidades 
de manufactura y .10 unidades de servicios. Por cada unidad de pro- 
ducción, el sector de servicios consume .10 unidades de servicios, 
.60 unidades de manufactura, pero ningún producto de agricultura. 


1. 


Construya la matriz de consumo adecuada para esta economía, 
y determine cuáles demandas intermedias se crean si agricultura 
planea producir 100 unidades. 


Determine los niveles de producción que se necesitan para sa- 
tisfacer una demanda final de 20 unidades para agricultura, sin 
demanda final para los otros sectores. (No calcule una matriz 
inversa). 


Determine los niveles de producción necesarios para satisfa- 
cer una demanda final de 20 unidades para manufactura, sin 
demanda final para los otros sectores. (No calcule una matriz 
inversa). 





Servicios 


E 
E 
de 

=u 


Determine los niveles de producción necesarios para satisfacer 
una demanda final de 20 unidades para manufactura, 20 para 
agricultura y O unidades para servicios. 


Considere el modelo de producción x = Cx + d para una eco- 
nomía con dos sectores, donde 


c=[% 2h a= [io] 


Use una matriz inversa y determine el nivel de producción nece- 
sario para satisfacer la demanda final. 


. Xe Zi 0) 16 
Repita el ejercicio 5 con C = E 3 |ra= Dl 
Sean C y d como en el ejercicio 5. 


a) Determine el nivel de producción necesario para satisfa- 
cer una demanda final para una unidad de producción del 
sector 1. 


b) Con base en una matriz inversa, determine el nivel de 
producción necesario para satisfacer una demanda final 


51 
de | a) 


10. 


11. 


51 50 1 . 
c) Con base en el hecho de que | a = [0] + Al expli- 


que cómo y por qué están relacionadas las respuestas a los 
incisos a) y b) y al ejercicio 5. 


Sea C una matriz de consumo de n x n cuyas sumas de columna 
son menores a 1. Sea x el vector de producción que satisface la 
demanda final d, y sea Ax un vector de producción para satis- 
facer una demanda final diferente Ad. 


a) Demuestre que si la demanda final cambia de d a d + Ad, 
entonces el nuevo nivel de producción debe ser x + Ax. 
Así, Ax indica las cantidades en que debe cambiar la pro- 
ducción para compensar el cambio Ad en la demanda. 


b) Sea Ad el vector en R” con 1 en la primera entrada y ceros 
en las demás. Explique por qué la producción correspon- 
diente Ax es la primera columna de (I — C)”!. Esto muestra 
que la primera columna de (1 — C)”! indica las cantida- 
des que deben producir los diversos sectores para satisfacer 
un aumento de una unidad en la demanda final para la pro- 
ducción del sector 1. 


Resuelva la ecuación de producción de Leontief para una eco- 
nomía con tres sectores, considerando que 


2 2 0 40 
C=|3 1 3| y d=|60 
1 0 2 80 


La matriz de consumo C para la economía de Estados Unidos 
en 1972 tiene la propiedad de que cada entrada de la matriz 
(1 — C) 1 es diferente de cero (y positiva).! ¿Qué dice esto acer- 
ca del efecto de aumentar la demanda de la producción sola- 
mente en un sector de la economía? 


La ecuación de producción de Leontief, x = Cx + d, general- 
mente está acompañada por una ecuación de precio dual, 
p=C"p+yv 

donde p es un vector de precio cuyas entradas listan el precio 
por unidad de producción de cada sector, y v es un vector de va- 
lor agregado cuyas entradas listan el valor agregado por unidad 
de producción. (El valor agregado incluye salarios, utilidades, 
depreciación, etcétera). Un hecho importante en economía es 
que el producto interno bruto (PIB) se puede expresar de dos 
maneras: 


T, 


{producto interno bruto} = pd = vx 


Compruebe la segunda igualdad. [Sugerencia: Calcule px de 
dos maneras]. 


1 Wassily W. Leontief, “The World Economy of the Year 2000”, Scientific 


American, septiembre de 1980, pp. 206-231. 


12. 


13. 


14. 


15. 
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Sea C una matriz de consumo tal que C” > 0 cuando m > oo, 
y para m = 1, 2,..., sea Dm = I + C + + + C”. Encuentre 
una ecuación en diferencias que relacione Dm y Dm+1 Y, a par- 
tir de ella, obtenga un procedimiento iterativo con la finalidad 
de calcular la fórmula (8) para (1 — C y. 


[M] La siguiente matriz de consumo C está basada en datos de 
entrada y salida para la economía de Estados Unidos en 1958, 
con datos para 81 sectores agrupados en 7 sectores de mayores 
dimensiones: 1. productos no metálicos personales y domés- 
ticos, 2. productos metálicos finales (como vehículos motori- 
zados), 3. productos básicos de metal y minería, 4. productos 
básicos no metálicos y de agricultura, 5. energía, 6. servicios, y 
7. entretenimiento y productos diversos.? Encuentre los nive- 
les de producción necesarios para satisfacer la demanda final d. 
(Las unidades están en millones de dólares). 


.1588 .0064 .0025 .0304 .0014 .0083 .1594 
.0057 .2645 .0436 .0099 .0083 .0201 .3413 
.0264 .1506 .3557 .0139 .0142 .0070 .0236 
.3299 .0565 .0495 .3636 .0204 .0483 .0649 |, 
.0089 .0081 .0333 .0295 .3412 .0237 .0020 
.1190 .0901 .0996 .1260 .1722 .2368 .3369 
.0063 .0126 .0196 .0098 .0064 .0132 .0012 
74,000 
56,000 
10,500 
d= 25,000 
| 17,500 
196,000 
5,000 


[M] El vector de demanda del ejercicio 13 es razonable para 
los datos de 1958, pero el análisis de Leontief de la economía 
mencionado en el mismo ejercicio utilizó un vector de demanda 
más cercano a los datos de 1964: 


d = (99640, 75548, 14444, 33501, 23527, 263985, 6526) 


Encuentre los niveles de producción necesarios para satisfacer 
esta demanda. 


[M] Use la ecuación (6) para resolver el problema del ejerci- 
cio 13. Considere que x® = d, y para k = 1, 2,..., calcule 
x® = d + Cx% d, ¿Cuántos pasos se necesitan para obtener 
una respuesta al ejercicio 13 con cuatro cifras significativas? 


2 Wassily W. Leontief, “The Structure of the U.S. Economy”, Scientific Ame- 
rican, abril de 1965, pp. 30-32. 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Se cuenta con los siguientes datos: 


Insumos necesarios por unidad de producción 





Comprados por: Bienes Servicios Demanda externa 
Bienes 32 4 20 
Servicios 0 3 30 


El modelo de entrada y salida de Leontief es x = Cx + d, donde 


es al. 12% 


2.7 APLICACIONES A LOS GRÁFICOS POR COMPUTADORA 


1 


FIGURA 1 
N regular. 


2 


Los gráficos por computadora son imágenes desplegadas o animadas en una pantalla de compu- 
tadora. Las aplicaciones de los gráficos por computadora están ampliamente difundidas y 
proliferan con rapidez. Por ejemplo, el diseño asistido por computadora (CAD) es una parte 
integral de muchos procesos de ingeniería, como el proceso de diseño de aeronaves descrito 
en la introducción de este capítulo. La industria del entretenimiento ha realizado el uso más 
espectacular de los gráficos por computadora: desde los efectos especiales en las películas 
Matrix a la Xbox de PlayStation 2. 

La mayoría de los programas interactivos de cómputo diseñados para los negocios y la 
industria utilizan gráficos por computadora en los despliegues de pantalla y en otras funcio- 
nes, como el despliegue gráfico de datos, la autoedición, y la producción de diapositivas para 
presentaciones comerciales y educativas. Por consiguiente, cualquier persona que estudie un 
lenguaje de computadora siempre pasa algún tiempo aprendiendo a usar gráficos de, por lo 
menos, dos dimensiones (2D). 

En esta sección se examinará algo de las matemáticas básicas que se usan para manipu- 
lar y desplegar imágenes gráficas, como el modelo de alambre de un avión. Una imagen (o 
dibujo) de ese tipo consta de varios puntos, líneas rectas o curvas conectados, e información 
sobre cómo llenar regiones cerradas delimitadas por esas rectas y curvas. Con frecuencia, las 
líneas curvas se aproximan utilizando segmentos de línea recta cortos, y una figura se define 
matemáticamente por medio de una lista de puntos. 

Entre los símbolos gráficos más sencillos utilizados en 2D están las letras usadas como 
etiquetas en la pantalla. Algunas letras se guardan como objetos de alambre; otras, con porcio- 
nes curvas, se almacenan con fórmulas matemáticas adicionales para las curvas. 


EJEMPLO 1 La letra N mayúscula de la figura 1 está determinada por ocho puntos o 
vértices. Las coordenadas de los puntos se pueden almacenar en una matriz de datos, D. 


Vértice: 
1 2 3 4 5 6 7 8 
coordenada x la 5 5 6 6 55 5.5 al -D 
coordenada y [O 0 642 0 8 8 158 8 


Además de D, es necesario especificar cuáles vértices están conectados con líneas, pero aquí 
se omite este detalle. E 


La principal razón para describir los objetos gráficos por medio de segmentos de lí- 
neas rectas es que las transformaciones estándar en los gráficos por computadora mapean 
segmentos de línea sobre otros segmentos de línea. (Por ejemplo, véase el ejercicio 26 de 
la sección 1.8). Una vez transformados los vértices que describen un objeto, es posible co- 


12 4 


FIGURA 2 
N inclinada. 


FIGURA 3 
Transformación compuesta de N. 


al A 





AHH 1 41 
-4 2 2 4 
Ls 4 
Traslación por 3 1 
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nectar sus imágenes con las líneas rectas adecuadas para producir la imagen completa del 
objeto original. 


Di 23 
0 1 


trasquilado x > Ax sobre la letra N del ejemplo 1. 


EJEMPLO 2 A partir de A = | 


| describa el efecto de la transformación de 


SOLUCIÓN Por la definición de multiplicación de matrices, las columnas del producto AD 
contienen las imágenes de los vértices de la letra N. 


l 2 3 4 5 6 7 8 
0 .5 2105 6 8 75 5.895 A 
8 


aele O 6.420 0 8 1.580 8 


Los vértices transformados se dibujan en la figura 2, junto con los segmentos de línea conec- 
tores que corresponden a los de la figura original. E 


La N cursiva de la figura 2 se ve demasiado ancha. Para compensar ese hecho, se puede 
reducir la anchura mediante una transformación de escala que afecta las coordenadas x de los 
puntos. 


EJEMPLO 3 Calcule la matriz de la transformación que realiza una transformación de 
trasquilado, como en el ejemplo 2, y que después modifica a escala todas las coordenadas x 
por un factor de .75. 


SOLUCIÓN La matriz que multiplica la coordenada x de un punto por .75 es 


75 0 
sef aa 


Así que la matriz de la transformación compuesta es 


75 0||1 .25 
sa=[ 5 Silo 
_|.75  .1875 
10 1 
El resultado de esta transformación compuesta se muestra en la figura 3. E 


Las matemáticas de los gráficos por computadora están íntimamente relacionadas con la 
multiplicación de matrices. Por desgracia, trasladar un objeto a una pantalla no corresponde 
directamente a la multiplicación de matrices porque la traslación no es una transformación 
lineal. La manera estándar de evitar esta dificultad es introducir lo que se conoce como coor- 
denadas homogéneas. 


Coordenadas homogéneas 


Cada punto (x, y) en R? se puede identificar con el punto (x, y, 1) en el plano en R? que se 
encuentra una unidad por encima del plano xy. Se dice que (x, y) tiene coordenadas homogé- 
neas (x, y, 1). Por ejemplo, el punto (0, 0) tiene coordenadas homogéneas (0, 0, 1). Las coor- 
denadas homogéneas de puntos no se suman ni se multiplican por escalares, pero se pueden 
transformar mediante multiplicación por matrices de 3 x 3. 


EJEMPLO 4 Una traslación de la forma (x, y) > (x + h, y + k) se escribe en coorde- 
nadas homogéneas como (x, y, 1) > (x + h, y + k, 1). Esta transformación se puede calcular 
mediante la multiplicación de matrices: 


1 0 h x x+h 
0 1 k y|=|y+k E 
0 0 1 1 1 
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Figura original 


Después del escalamiento 


Después de la rotación 





Después de la traslación 


EJEMPLO 5 Cualquier transformación lineal sobre R? se representa con respecto a las 
A 
coordenadas homogéneas por medio de una matriz particionada de la forma | o 1 | don- 


de A es una matriz de 2 x 2. Ejemplos típicos son: 


cosp —senp 0 Oo 1 0 s 0 0 
seng cose 0j, 1 0 0j, 0 1 0 
0 0 1 0 0. 1 0 0 1 
Rotación en sentido Reflexión Escala de x por s 
antihorario en torno a través de y = x y de y por t 
al origen, ángulo y A 


Transformaciones compuestas 


El movimiento de una figura en la pantalla de una computadora a menudo requiere de dos 
o más transformaciones básicas. La composición de tales transformaciones corresponde a la 
multiplicación de matrices cuando se usan coordenadas homogéneas. 


EJEMPLO 6 Encuentre la matriz de 3 x 3 que corresponde a la transformación com- 
puesta de un escalamiento por .3, una rotación de 90* en torno al origen y, por último, una 
traslación que suma (—.5, 2) a cada punto de una figura. 


SOLUCIÓN Si p = 7/2, entonces sen ¢ = 1 y cos y = 0. A partir de los ejemplos 4 y 5, 
se tiene que 


Escalamiento 3 0 0 x 
—— 0.3 0 y 
1 0 0 1 1 


Rotación 
—— > 


o 
o 
y 
o 

< 


0 0 1 0 0 1 1 
Traslación 0 =.5 -1 0 3 0 0 x 
T 1 2 1 0 0 0.3 0 y 
0 0 1 0 1 0 0 1 1 


La matriz para la transformación compuesta es 


1. 0.5 0-1 0 3 0 0 
0 1 2 1.0.0 0 3 0 
0 0 1 0 0 1 0 1 
0 —-1 —.5 3 0 0 0 —.3 —.5 
=|1 0 2 0.3 0|=3 0 2 m 
0 0 1 0 0 1 0 0 1 


Gráficos 3D por computadora 


Algunos de los más recientes y estimulantes trabajos en gráficos por computadora se relacio- 
nan con el modelado molecular. Un biólogo tiene la posibilidad de examinar una molécula 
simulada de proteína utilizando gráficos tridimensionales (3D), y así buscar los sitios activos 
que pueden aceptar la molécula de un medicamento. El biólogo podrá hacer girar y trasladar 
un medicamento experimental para tratar de unirlo a la proteína. Esta capacidad de visualizar 
reacciones químicas potenciales es vital para la investigación de medicamentos modernos y 
del cáncer. De hecho, los avances en el diseño de medicamentos dependen, en cierta medida, 
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del progreso que se logre en la capacidad de los gráficos por computadora para construir si- 
mulaciones realistas de las moléculas y sus interacciones.' 

La investigación actual en el modelado de moléculas se enfoca en la realidad virtual, un 
entorno en el que un investigador puede ver y sentir la molécula de medicamento deslizarse 
dentro de la proteína. En la figura 4 se ilustra el proceso de retroalimentación táctil con un 
manipulador remoto que despliega la fuerza. 





FIGURA 4 Modelado molecular en realidad virtual. 
(Departamento de Ciencias de la Computación, 
University of North Carolina en Chapel Hill. 
Fotografía de Bo Strain). 


Otro diseño de realidad virtual consiste en un casco y un guante que detectan los movimientos 
de la cabeza, la mano y los dedos. El casco incluye dos pequeñas pantallas de computadora, 
una para cada ojo. Hacer que este medio virtual sea más realista es un desafío para ingenieros, 
científicos y matemáticos. Las matemáticas que se manejan aquí apenas abren la puerta a este 
campo de la investigación. 


Coordenadas 3D homogéneas 


Por analogía con el caso bidimensional, se dice que (x, y, z, 1) son las coordenadas homogé- 
neas para el punto (x, y, z) en R?. En general, (X, Y, Z, H) son las coordenadas homogéneas 
para (x, y, z) si H + 0y 


X Y Z 
Fo =p y 2=5 (1) 


Cada múltiplo escalar diferente de cero de (x, y, z, 1) proporciona un conjunto de coordenadas 
homogéneas para (x, y, z). Por ejemplo, (10, —6, 14, 2) y (—15, 9, —21, —3) son coordena- 
das homogéneas para (5, —3, 7). 

El siguiente ejemplo ilustra las transformaciones utilizadas en el modelado molecular 
para introducir un medicamento en una molécula de proteína. 


EJEMPLO 7 Encuentre las matrices de 4 x 4 para las siguientes transformaciones: 


a) Rotación en torno al eje y a través de un ángulo de 30*. (Por convención, un ángulo posi- 
tivo es un giro en sentido antihorario cuando se ve hacia el origen desde la mitad positiva 
del eje de rotación, en este caso, el eje y). 


1 Robert Pool, “Computing in Science”, Science 256, 3 de abril de 1992, p. 45. 
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b) Traslación mediante el vector p = (—6, 4, 5). 


SOLUCIÓN 


a) Primero, construya la matriz de 3 x 3 para la rotación. El vector e; gira hacia abajo en la 
dirección del eje z negativo, y se detiene en (cos 309, 0, — sen 30°) = (13/2, 0, —.5). El 
vector e, sobre el eje y no se mueve, pero ez sobre el eje z gira hacia abajo en dirección del 
eje x positivo, hasta detenerse en (sen 30%, O, cos 30%) = (.5, 0, 1 3/2). Véase la figura 5. 
De acuerdo con la sección 1.9, la matriz estándar para esta rotación es 





vV3/2 0 5 
0 1 0 
=5 0  y3/2 
FIGURA 5 Por lo tanto, la matriz de rotación para las coordenadas homogéneas es 

V3/2 0 5 0 
g 0 1 0 0 
| O R 0 
0 0 0 1 


b) Se desea que (x, y, z, 1) mapee a (x — 6, y + 4,z + 5, 1). La matriz que logra esto es 


O O O m 
oom. o 
D e O S 
-anA A 


Proyecciones en perspectiva 


Un objeto tridimensional se representa en la pantalla de dos dimensiones de una computadora 
proyectándolo sobre un plano visual. (Se omiten otros pasos importantes, como la selección 
de la parte del plano visual que se desplegará en la pantalla). Para simplificar, considere que el 
plano xy representa la pantalla de la computadora e imagine que el ojo de un observador está 
sobre el eje positivo z, en un punto (0, 0, d). Una proyección en perspectiva mapea cada punto 
(x, y, z) sobre un punto de imagen (x*, y*, 0) de manera que los dos puntos y la posición del 
ojo, llamada centro de proyección, estén sobre una recta. Véase la figura 6a). 


(e*, y*, 0) 








a) b) 
FIGURA 6 Proyección en perspectiva de (x, y, z) sobre (x*, y*, 0). 





S bajo la transformación de 


perspectiva. 
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El triángulo en el plano xz de la figura 6a) se vuelve a trazar en el inciso b) mostrando la 
longitud de los segmentos de recta. Con triángulos similares se muestra que 


x x ye do x 
d d=z A — d-z l-z/d 





De manera análoga, 


* y 
l—2z/d 





y 


Usando coordenadas homogéneas, es posible representar la proyección en perspectiva mediante 


una matriz, por ejemplo, P. Se desea que (x, y, z, 1) se mapee en a E 0,1]. 
l1=-2/d' 1-2/d 
Al modificar a escala estas coordenadas por 1 — z/d, también se puede utilizar (x, y, 0, 


1 — z/d) como coordenadas homogéneas para la imagen. Ahora resulta fácil desplegar P. 
De hecho, 


x 1 0 0 0 X x 
pl o 1 0 0 y | y 
Z o 0 0 0 Z 0 
1 0 0 -—1/d 1 1 1=2z/d 


EJEMPLO 8 Sea Sla caja con vértices (3, 1, 5), (5, 1, 5), (5, 0, 5), (3, 0, 5), (3, 1, 4, (5, 1, 
4), (5, 0, 4) y (3, 0, 4). Encuentre la imagen de S bajo la proyección en perspectiva con centro 
de proyección en (0, 0, 10). 


SOLUCIÓN Sean P la matriz de proyección y D la matriz de datos para S usando coordena- 
das homogéneas. La matriz de datos para la imagen de S es 


Vértice: 
t 2 3 4 5 6 7 8 
1 0 0 0 30 BBD A 
0 1 0 0 1 1 0 O 1 1 0 0 
Sono 0 0 5 5 5 5 4 4 4 4 
0 0 —1/10 1 l 1 1 1 1 1 1 1 
3 5 5 3 3 5 5 3 
|1 100 1100 
=o 0o 0 0 0 0 0 0 
5 5 5 5 6 6 6 6 


Para obtener las coordenadas en R?, use la ecuación (1) que está antes del ejemplo 7 y divida 


las tres entradas superiores de cada columna entre la entrada correspondiente de la cuarta 
fila: 


Vértice: 
1 2 3 4 5 6 7 8 
6 10 10 6 5 83 83 5 
2 2 0 0 17 17 0 0 
0 0 0 0 0 0 0 0 


En el sitio Web de este libro se presentan algunas aplicaciones interesantes de los gráficos 
por computadora, incluyendo un análisis más profundo de las proyecciones en perspectiva. 


Uno de los proyectos para computadora presentados en el sitio Web implica una animación 
sencilla. 
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NOTA NUMÉRICA 





El movimiento continuo de objetos gráficos en 3D requiere de cálculo intenso con ma- 
trices de 4 x 4, en especial cuando las superficies deben parecer realistas, con la textura 
e iluminación adecuadas. Las estaciones de trabajo para gráficos por computadora 
de acabado fino realizan operaciones con matrices de 4 x 4 y algoritmos de gráficos 


integrados en sus microchips y circuitos. Estas estaciones son capaces de realizar miles 
de millones de multiplicaciones de matrices por segundo necesarias para presentar la 
animación realista en color en los programas de juegos 3D.? 


Lectura adicional 


James D. Foley, Andries van Dam, Steven K. Feiner y John F. Hughes, Computer Graphics: 
Principles and Practice, 3a. ed. (Boston, MA: Addison-Wesley, 2002), capítulos 5 y 6. 


PROBLEMA DE PRÁCTICA 


La rotación de una figura alrededor de un punto p en R? se logra primero con una traslación 
de la figura mediante —p, luego con una rotación alrededor del origen, y finalmente trasla- 
dándola de regreso mediante p. Véase la figura 7. Construya la matriz de 3 x 3 que hace girar 
puntos en un ángulo de —30* en torno al punto (—2, 6), usando coordenadas homogéneas. 


X2 X2 X2 X2 











| a | mM | xi | a 


a) Figura original. c) Rotación en 


torno al origen. 


b) Traslación al origen 
mediante —p. 


d) Traslación de regreso 
mediante p. 


FIGURA 7 Rotación de la figura con respecto al punto p. 


2.7 EJERCICIOS 


. ¿Qué matriz de 3 x 3 tendrá el mismo efecto en las coordenadas 


homogéneas para [R? que la matriz de corte A del ejemplo 2? 


. Utilice multiplicación de matrices para encontrar la imagen 


. Refleje los puntos a través del eje x, y después hágalos girar 45 


con respecto al origen. 


. Haga girar los puntos 45” con respecto al origen, después reflé- 


4 2 
0 2 
mación que refleja los puntos a través del eje y. Bosqueje tanto 
el triángulo original como su imagen. 


jel través del eje x. 
del triángulo con datos D = | a bajo la transfor- AS 
7. Haga girar los puntos un ángulo de 60” con respecto al punto 


(6, 8). 


8. Haga girar los puntos un ángulo de 45” con respecto al punto 


En los ejercicios 3 a 8, determine las matrices de 3 x 3 que produ- 6.7 


cen las transformaciones 2D compuestas, usando coordenadas ho- 
mogéneas. 9. Una matriz de datos de 2 x 100 contiene las coordenadas de 
100 puntos. Calcule el número de multiplicaciones necesarias 
para transformar estos puntos usando dos matrices arbitrarias 
A y B de 2 x 2. Considere las dos posibilidades A(BD) y (AB)D. 
Analice las implicaciones de sus resultados con los cálculos de 
los gráficos por computadora. 


3. Traslade con (2, 1), y después haga girar 90% con respecto al 
origen. 


4. Traslade con (— 1, 4), y después modifique a escala la coorde- 
nada x por 1/2 y la coordenada y por 3/2. 


2 Véase Jan Ozer, “High-Performance Graphics Boards”, PC Magazine 19, 1 de septiembre de 2000, pp. 187-200. 
También “The Ultimate Upgrade Guide: Moving On Up”, PC Magazine 21, 29 de enero de 2002, pp. 82-91. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


Considere las siguientes transformaciones geométricas 2D: D, 
una dilatación (en la que se modifica la escala de las coordena- 
das x y y por el mismo factor); R, una rotación; y T, una trasla- 
ción. ¿Conmuta D con R? Es decir, ¿es D(R(x)) = R(D(X)) para 
toda x en R?? ¿Conmuta D con T? ¿Conmuta R con 7? 


Una rotación en la pantalla de una computadora a veces se imple- 
menta como el producto de dos transformaciones de trasquilado 
y escalamiento, que pueden acelerar los cálculos para determi- 
nar cómo se presenta en realidad una imagen gráfica en tér- 
minos de los pixeles de la pantalla. (La pantalla consiste en filas 
y columnas de puntos pequeños, llamados pixeles). La primera 
transformación A; trasquila verticalmente y después comprime 
cada columna de pixeles; la segunda transformación A» trasquila 
horizontalmente y después estira cada fila de pixeles. Sean 


1 0 0 
Aı = | seng cose 0J, 
0 0 1 
secp —tanp 0 
A = 0 1 0j, 
0 0 1 


y muestre que la composición de las dos transformaciones es 
una rotación en R?. 

















Una rotación en [R?, por lo general, requiere cuatro multiplica- 
ciones. Calcule el siguiente producto y demuestre que la matriz 
para una rotación se puede factorizar en tres transformaciones 
de trasquilado (cada una de las cuales requiere de tan solo una 
multiplicación). 


1 —tang/2 0 1 0 0 
0 1 0 senp 1 10) 
0 0 1 0 0 1 

1 —tang/2 0 

0 1 0 

0 0 1 


Las transformaciones usuales en coordenadas homogéneas para 
gráficos 2D por computadora implican matrices de 3 x 3 en la 


forma [o z] donde A es una matriz de 2 x 2 y p está en R?. 


Demuestre que una transformación de este tipo equivale a una 
transformación lineal en R? seguida por una traslación. [Suge- 
rencia: Encuentre una factorización de matrices adecuada en la 
que intervengan matrices particionadas]. 


Demuestre que la transformación del ejercicio 7 es equivalente 
a una rotación con respecto al origen seguida por una traslación 
mediante p. Encuentre p. 


¿Qué vector en R? tiene las coordenadas homogéneas 
do O 

ETTE a)? 

¿Son (1, —2, —3, 4) y (10, —20, —30, 40) coordenadas homo- 

géneas para el mismo punto en R3? ¿Por qué? 


17. 


18. 


19. 


20. 


2.7 Aplicaciones a los gráficos por computadora 145 


Proporcione la matriz de 4 x 4 que hace girar puntos en [R3 
con respecto al eje x a través de un ángulo de 60%. (Véase la 
figura). 





Encuentre la matriz de 4 x 4 que hace girar puntos en R? con 
respecto al eje z a través de un ángulo de —30%, y después los 
traslada mediante p = (5, —2, 1). 


Sea S el triángulo con vértices (4.2, 1.2, 4), (6, 4, 2) y (2, 2, 6). 
Encuentre la imagen de S bajo la proyección en perspectiva con 
centro de proyección en (0, O, 10). 


Sea S el triángulo con vértices (7, 3, —5), (12, 8, 2), (1, 2, 1). 
Encuentre la imagen de S bajo la proyección en perspectiva con 
centro de proyección en (0, O, 10). 


Los ejercicios 21 y 22 se refieren a la manera en que se especifica el 
color para mostrarse en gráficos por computadora. En una pantalla 
de computadora, el color se codifica utilizando tres números (R, G, 
B) para indicar la cantidad de energía que un cañón debe transmitir 
a los puntos fosforescentes rojos, verdes y azules sobre la pantalla 
de la computadora. (Un cuarto número especifica la luminosidad o 
intensidad del color). 


21. 


22. 


[M] El color real que ve un observador en una pantalla está 
influido por el tipo específico y la cantidad de material fosfores- 
cente en la pantalla. De esta manera, cada fabricante de panta- 
llas de computadora debe hacer la conversión entre los datos (R, 
G, B) y un estándar internacional para color, CIE, que usa tres 
colores primarios llamados X, Y y Z. Una conversión típica para 
el material fosforescente de persistencia breve es 


.61 .29 .150 R X 
.35 .59  .063 G|=|Y 
.04 .12  .787 B Z 


Un programa de computadora envía un flujo de información 
acerca del color a la pantalla usando datos del estándar CIE (X, 
Y, Z). Encuentre la ecuación que convierte esta información en 
los datos (R, G, B) que necesita el cañón de electrones de la 
pantalla. 


[M] La señal transmitida por la televisión comercial describe 
cada color por medio de un vector (Y, I, Q). Si la pantalla es en 
blanco y negro, solo se utiliza la coordenada Y. (Esto da una me- 
jor imagen monocromática que si se usa el estándar CIE para los 
colores). La correspondencia entre Y/O y un color “estándar” 
RGB está dada por 


Y .299 6.587 .114 R 
I | =| .596 —.275 —.321 G 
Q .212 —-.528  .311 B 
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(Un fabricante de pantallas cambiaría las entradas de la matriz ción de televisión a los datos RGB necesarios para la pantalla 
para que funcionaran con sus pantallas RGB). Encuentre la del televisor. 
ecuación que convierte los datos Y/O transmitidos por la esta- 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Acomode las matrices de derecha a izquierda para las tres operaciones. Usando p = (—-2, 6), 
cos(—30°) = 3/2 y sen(—30°) = —.5, se tiene: 


Traslación de Rotación con Traslación 


regreso mediante p respecto al origen mediante —p 
1 0 —2][73/⁄2 1⁄2 oļfıi o 2 
0 1 6||-1/2 43/2 ojļjļ|0 1 —6 


0 0 1|| 0 o  1j|0 0 1I 


V3/2 1/2 v3 -5 
=| —1/2 3/2 -343+5 
0 0 1 


2.8 | SUBESPACIOS DE R” 


X 


X. 


Esta sección se concentra en los importantes conjuntos de vectores en R” Hamados subespa- 
cios. Con frecuencia surgen subespacios conectados con alguna matriz A, los cuales brindan 
información útil acerca de la ecuación Ax = b. Los conceptos y la terminología de esta sec- 
ción se usarán repetidamente a lo largo del libro.' 


DEFINICIÓN Un subespacio de R” es cualquier conjunto H en R” que tenga tres propiedades: 
a) El vector cero está en H. 
b) Para cada u y v en H, la suma u + v está en H. 
c) Para cada u en H y cada escalar c, el vector cu está en H. 


A Dicho con palabras, un subespacio es cerrado bajo la suma y la multiplicación escalar. 
Como se verá en los siguientes ejemplos, casi todos los conjuntos de vectores analizados en 
el capítulo 1 son subespacios. Por ejemplo, un plano que pasa por el origen es la manera es- 
tándar de visualizar el subespacio del ejemplo 1. Véase la figura 1. 


EJEMPLO 1 Siv; y v están en R” y H = Gen (vi, v2), entonces H es un subespacio 


%2 de R”. Para comprobar este enunciado, observe que el vector cero está en H (porque 
FIGURA 1 Gen fv;, va) tiene un 0Ov¡ + Ov, es una combinación lineal de v; y v2). Ahora tome dos vectores arbitrarios en H, 
plano a través del origen. por ejemplo, 


U=5SIV+5SV2 y V=1]V1 + va 
Luego, 
u + v = (s1 + ti)vi + (52 + b)Jva 


lo que demuestra que u + v es una combinación lineal de vı y v2 y, por lo tanto, está 
en H. Además, para cualquier escalar c, el vector cu está en H, ya que cu = c(s¡V] + S2V2) = 
(csi)v1 + (cs2)v2. E 


1 Las secciones 2.8 y 2.9 se incluyen aquí para permitir que los lectores pospongan el estudio de la mayor parte o el 
total de los siguientes dos capítulos y vayan directamente al capítulo 5, si así lo desean. Omita estas dos secciones 
si planea estudiar el capítulo 4 antes que el capítulo 5. 


va 


Mi 





cr 


s2 
K v 


vi + 0, VI kv. 


Xx 


DEFINICIÓN 
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Si v¡ no es cero, y si vz es un múltiplo de v¡, entonces v¡ y v2 simplemente generan 
una recta que pasa a través del origen. Por lo tanto, una recta que pasa por el origen es otro 
ejemplo de un subespacio. 


EJEMPLO 2 Una recta £ que no pasa por el origen no es un subespacio, porque no con- 
tiene al origen, como se requiere. Además, la figura 2 muestra que L no es cerrada bajo la 








suma o la multiplicación escalar. E 
u+yv 
i 5 aW 
wo a 
vV E -7 f 
[ | 
L L 
u + v no está sobre L 2w no está sobre L 
FIGURA 2 
EJEMPLO 3 Para vı,..., Vp en R”, el conjunto de todas las combinaciones lineales de 


V1,- .-, Vp es un subespacio de R”. La comprobación de este enunciado es similar al argumento 
dado en el ejemplo 1. Ahora nos referimos a Gen {v1,..., Vp} como el subespacio generado 
por V1,..., Vp. E 


Observe que R” es un subespacio de sí mismo porque tiene las tres propiedades reque- 
ridas para un subespacio. Otro subespacio especial es el conjunto que consta exclusivamente 
del vector cero en R”. Este conjunto, llamado subespacio cero, también satisface las condi- 
ciones de un subespacio. 


Espacio de columnas y espacio nulo de una matriz 


Los subespacios de R” generalmente se presentan en aplicaciones y en la teoría en una de 
dos formas. En ambos casos, es posible relacionar el subespacio con una matriz. 


El espacio de columnas de una matriz A es el conjunto Col A de todas las combina- 
ciones de las columnas de A. 


Si A = [a; =+ a], con las columnas en R”, entonces Col A es lo mismo que 
Gen {a;,..., an}. En el ejemplo 4 se muestra que el espacio columna de una matriz de 
m x n es un subespacio de R”. Observe que Col A es igual a R” solo cuando las colum- 
nas de A generan a R”. Si no la generan, Col A es solo una parte de R”. 


1 —3 —4 3 
EJEMPLO 4 Sean 4=|-4 6 —2ļ|yb= 3 |. Determine si b es el espacio 
-3 7 6 —4 


columna de A. 


SOLUCIÓN El vector b es una combinación lineal de las columnas de A si y solo si b se pue- 
de escribir como Ax para alguna x, es decir, si y solo si la ecuación Ax = b tiene una solución. 
Reduciendo por filas a la matriz aumentada [A b], se tiene 


1-3 -4 3 13 —4 3 1-3 —4 3 
—4 6-2 3|-=|0 —6 -18 15|=|0 —6 -18 15 
23. 7 6-4 0-2 —6 5 0.0 0 0 


se concluye que Ax = b es consistente, y b está en Col A. E 
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DEFINICIÓN 


TEOREMA 12 


DEFINICIÓN 


X3 


e3 





X 
e, 2 


*1 


FIGURA 3 
La base estándar para [R3. 


La solución del ejemplo 4 indica que cuando un sistema de ecuaciones lineales está es- 
crito en la forma Ax = b, el espacio columna de A es el conjunto de todas las b para las que 
el sistema tiene una solución. 


El espacio nulo de una matriz A es el conjunto Nul A de todas las soluciones posibles 
para la ecuación homogénea Ax = 0. 


Cuando A tiene n columnas, las soluciones de Ax = 0 pertenecen a RR”, y el espacio nulo 
de A es un subconjunto de R”. De hecho, Nul A tiene las propiedades de un subespacio de 
matrices de R”. 


El espacio nulo de una matriz A de m x n es un subespacio de R”. De manera equiva- 
lente, el conjunto de todas las soluciones posibles para un sistema Ax = 0 de m ecuacio- 
nes lineales homogéneas con n incógnitas es un subespacio de R”. 


DEMOSTRACIÓN El vector cero está en Nul A (porque A0 = 0). Para demostrar que 
Nul A satisface las otras dos propiedades requeridas para conformar un subespacio, tome 
cualesquiera u y v en Nul A. Es decir, se supone que Au = 0 y Av = 0. Así, por una propie- 
dad de la multiplicación de matrices, 


A(u + v) =4u+Av=0+0=0 


Por lo tanto, u + v satisface Ax = 0, y asíu + v está en Nul A. Además, para cualquier es- 
calar c, A(cu) = c(4u) = c(0) = 0, lo que demuestra que cu está en Nul A. E 


Para saber si un vector dado v está en Nul A, solo se calcula Av para ver si Av es el vec- 
tor cero. Puesto que Nul A se describe por medio de una condición que debe comprobarse 
para cada vector, se dice que el espacio nulo está definido implícitamente. En contraste, el 
espacio columna se define explícitamente, ya que los vectores en Col A se pueden construir 
(con combinaciones lineales) a partir de las columnas de A. Para crear una descripción ex- 
plícita de Nul A, se resuelve la ecuación Ax = 0 y se escribe la solución en forma vectorial 
paramétrica. (Véase el ejemplo 6 que se presenta más adelante).? 


Base para un subespacio 


Como, por lo general, un subespacio contiene un número infinito de vectores, algunos problemas 
relacionados con subespacios se manejan mejor trabajando con un conjunto finito y pequeño de 
vectores que genere el subespacio. Cuanto menor sea el conjunto, será mejor. Es factible demos- 
trar que el conjunto generador más pequeño posible debe ser linealmente independiente. 


Una base de un subespacio H de R” es un conjunto linealmente independiente en H, 
que genera a H. 


EJEMPLO 5 Las columnas de una matriz invertible de n x n forman una base para toda 
R” ya que son linealmente independientes y generan R”, de acuerdo con el teorema de la 
matriz invertible. Una matriz de este tipo es la matriz identidad de n x n. Sus columnas 
se denotan mediante e;,..., €,: 


1 0 0 
l 
esj. jh, es]. |; a &= 
i a 5 ; 0 
0 0 1 
El conjunto fej,..., e, ) es la base estándar para R”. Véase la figura 3. E 


2 E1 contraste entre Nul A y Col A se analiza con mayor detalle en la sección 4.2. 
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El siguiente ejemplo muestra que el procedimiento estándar para escribir el conjunto 
solución de Ax = 0 en la forma vectorial paramétrica en realidad identifica una base para Nul 
A. Este hecho se utilizará en todo el capítulo 5. 


EJEMPLO 6 Encuentre una base para el espacio nulo de la matriz 


a 
al o 2 -3 
2-4 5 8&4 


SOLUCIÓN Primero, escriba la solución de Ax = 0 en forma vectorial paramétrica: 


1-2 0-1 3 0 xı — 2x2 — x4 +3x5;=0 

[4 020 O 1 2-2 0j, x3 + 2x4 — 2x5 = 0 

0o 0 0 0 0 0 0=0 

La solución general es xı = 2x2 + x4 — 3x5, x3 = —2x4 + 2x5, CON X2, X4 y X5 libres. 
X1 2x2 + Xx4— 3x5 2 1 —3 
X2 X2 1 0 0 
Xa: | = —2x4 + 2x5 = x| 0 | +x4| —2 | + x5 2 
X4 X4 0 1 0 
X5 X5 0 0 1 
t 1 f 
u v Ww 
= XU + X4V + X5W (1) 


La ecuación (1) indica que Nul A coincide con el conjunto de todas las combinaciones li- 
neales de u, v y w. Es decir, {u, v, w} genera Nul A. De hecho, esta construcción de u, v 
y w automáticamente las hace linealmente independientes, ya que (1) muestra que 0 = x2u + 
xa4V + xsw solamente si todos los pesos x2, x4 y x5 son cero. (Examine las entradas 2, 4 y 5 
del vector x2u + x4v + x5w). Así, {u, v, w} es una base para Nul A. E 


Encontrar una base para el espacio columna de una matriz, en realidad, representa menos 
trabajo que encontrar una base para el espacio nulo. Sin embargo, el método requiere cierta 
explicación. Comencemos con un caso sencillo. 


EJEMPLO 7 Encuentre una base para el espacio columna de la matriz 


1 0-3 5 0 
0O 1 2—1 0 
BS 0 0 0 0 1 
0 0 0 0 0 


SOLUCIÓN Denote las columnas de B mediante b,,..., bs y observe que b; = —3b, + 2b», 
y que b4 = 5b; — bz. El hecho de que b3 y b4 sean combinaciones de las columnas pivote 
significa que cualquier combinación de b;,..., b5 es en realidad solo una combinación de bj, 
b, y bs. Efectivamente, si v es cualquier vector en Col B, por ejemplo, 


v = c1b¡ + cab) + c3b3 + caba + csb; 
entonces, al sustituir bz y b4, se puede escribir v en la forma 
v = cib¡ + cab) + cx(—3b, + 2b>) + ca(5b¡ — b>) + csbs 


que es una combinación lineal de b;, b» y bs. Así, (by, b>, bs] genera Col B. También, b1, b2 
y bs son linealmente independientes, porque son columnas de una matriz identidad. Por lo 
tanto, las columnas pivote de B forman una base para Col B. E 
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La matriz B del ejemplo 7 está en forma escalonada reducida. Para manejar una matriz 
general A, recuerde que las relaciones de dependencia lineal entre las columnas de A se pue- 
den expresar en la forma Ax = 0 para alguna x. (Si algunas columnas no intervienen en una 
relación de dependencia particular, entonces las entradas correspondientes de x son cero). 
Cuando A se reduce por filas a la forma escalonada B, las columnas cambian en forma drás- 
tica, pero las ecuaciones Ax = 0 y Bx = 0 tienen el mismo conjunto de soluciones. Es decir, 
las columnas de A tienen exactamente las mismas relaciones de dependencia lineal que las 
columnas de B. 


EJEMPLO 8 Es posible comprobar que la matriz 


1 3 3 D9. 
ES 8 2 
2 3 0 7 1 
3 4-1 11-38 


A=la; a = a;]= 


es equivalente por filas a la matriz B del ejemplo 7. Encuentre una base para Col A. 


SOLUCIÓN A partir del ejemplo 7, las columnas pivote de A son las columnas 1, 2 y 5. Tam- 
bién, b3 = —3b, + 2b, y b4 = 5b¡ — b,. Puesto que las operaciones de fila no afectan las 
relaciones de dependencia lineal entre las columnas de la matriz, deberíamos tener que 


az=-—3a1+2a y as=5a¡ -— a 


Compruebe que ¡esto es cierto! Por el argumento del ejemplo 7, az y ay no son necesarias 
para generar el espacio columna de A. Además, (a, a, as) debe ser linealmente independien- 
te, ya que cualquier relación de dependencia entre ay, a, y as implicaría la misma relación 
de dependencia entre bı, b2 y bs. Puesto que {b;, b2, b5} es linealmente independiente, 
fa, az, as) también lo es y, por lo tanto, es una base para Col A. El 


El argumento del ejemplo 8 se puede adaptar para demostrar el siguiente teorema. 


Las columnas pivote de una matriz A forman una base para el espacio columna de A. 


Advertencia: Tenga cuidado de utilizar las columnas pivote de la misma A para la base de 
Col A. Con frecuencia, las columnas de una forma escalonada B no están en el espacio co- 
lumna de A. (Como se observa en los ejemplos 7 y 8, todas las columnas de B tienen ceros 
en sus últimas entradas y no pueden generar las columnas de A). 


PROBLEMAS DE PRÁCTICA 


1-1 5 7 
1. Sea A = 2 0 7ļ|yu= 3 |. ¿Está u en Nul 4? ¿Está u en Col A? 
=3..=5.:=3 2 
Justifique sus respuestas. 
0O 1 0 
2. Dada4=|0 0 1 |, encuentre un vector en Nul A y un vector en Col A. 
0 0 0 


3. Suponga que una matriz A de n x n es invertible. ¿Qué se puede decir acerca de Col A? 
¿Y de Nul A? 


2.8 EJERCICIOS 


En los ejercicios 1 a 4 se muestran conjuntos en R?. Suponga que 
los conjuntos incluyen las líneas de frontera. En cada caso, dé una 
razón específica por la cual el conjunto A no es un subespacio de [R?. 
(Por ejemplo, encuentre dos vectores en H cuya suma no esté en H, 
o encuentre un vector en H con un múltiplo escalar que no esté en H. 
Trace un dibujo). 


1. 
2. 
3. 
4. A 
1 -2 —3 
5. Sean vı = 3 |, v2 =| —3 | y w= | —3 |. Determine 
—4 7 10 
si w está en el subespacio de R? generado por v; y v2. 
1 4 5 
=3 —4 —3 
6. Sean v = 2 | vV = 5h v = 6 y 
3 sji 5 


-1 
u= E . Determine si u está en el subespacio de R* gene- 
|2] 


rado por {V1, V2, V3}. 
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7. Sean 
2 —3 —4 
v=]|—-8|ļ|, v= 8 |, v= 6 |, 
6 =1 -7 
6 
p=|-10 y A=| y, v, vs ]. 
11 


a) ¿Cuántos vectores hay en {v1, V2, V3}? 
b) ¿Cuántos vectores hay en Col A? 


c) Está p en Col A? ¿Por qué? 


8. Sean 
—2 —2 0 

v= 0j, v= Ik dam 35 
6 3 5 
—6 

yp= 1 |. Determine si p está en Col A, donde A = 
17 

[vi va val. 


9. Con A y p como en el ejercicio 7, determine si p está en Nul A. 


=5 
5 | y A como en el ejercicio 8, determine si u 
3 


está en Nul A. 


10. Con u = 


En los ejercicios 11 y 12, dé enteros p y q tales que Nul A sea un 
subespacio de R? y Col A sea un subespacio de R4. 


3 2 1 -5 
141. A=|-9 -4 1 7 

9 2 -5 1 

1 2 3 

4 5 l 
12. A=|-5 -1 o0] 


2 7 11 
3 3 4 


13. Para A como en el ejercicio 11, encuentre un vector diferente de 
cero en Nul A y un vector diferente de cero en Col A. 


a 


4. Para A como en el ejercicio 12, encuentre un vector diferente 
de cero en Nul A y un vector diferente de cero en Col A. 


Determine cuáles conjuntos de los ejercicios 15 a 20 son bases para 
R? o RR?. Justifique sus respuestas. 


El 


0] T5] f6 1 3 5 
e lo a A ii 
la -3 2| | —4 
3 6 1 3] -31 fo 
19. | -8 |,| 2 20. | -6|,| -6|1,| 71,|17 
1 -5 =7 7 5| |9 
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En los ejercicios 21 y 22 marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


21. a) Un subespacio de R” es cualquier conjunto H tal que: i. el 
vector cero está en H, ii. u, v y u + v están en H, y iii. c es 
un escalar y cu está en H. 


b) Si vi,..., Vp están en R”, entonces Gen {v1,..., Vp} es el 
mismo que el espacio columna de la matriz [v + vp]. 


c) El conjunto de todas las soluciones de un sistema de m 


ecuaciones homogéneas con n incógnitas es un subespacio 
de R”. 
d) Las columnas de una matriz invertible de n x n forman una 


base para R”. 


e) Las operaciones de fila no afectan las relaciones de depen- 
dencia lineal entre las columnas de una matriz. 


22. a) Un subconjunto H de R” es un subespacio si el vector cero 
está en H. 


b) Si B es la forma escalonada de una matriz A, entonces las 
columnas pivote de B forman una base para Col A. 


c) Dados los vectores v1,..., Vp en R”, el conjunto de todas las 


combinaciones lineales de estos vectores es un subespacio 
de R”. 


d) Sea H un subespacio de R”. Si x está en H, y y está en R”, 
entonces x + y está en H. 


e) El espacio columna de una matriz A es el conjunto de solu- 
ciones de Ax = b. 


En los ejercicios 23 a 26 se presenta una matriz A y una forma escalo- 
nada de A. Encuentre una base para Col A y una base para Nul A. 


4. 5 9-2 1 2 6 -5 
23. A=|6 5 1 12|=]|0 1 5 —6 
3 4 8-3 0 0o 0 
3 -6 9 0 1-2. 5 4 
24. A=|2 -4 7 2|=|0 0 3 6 
3 —6 6 —6 0o 0 0.0 
1 4 8 3 —7 
-1 2 1 3 4 
ii E E 
A o E 
1 4 8 0 
0.2.5 0-1 
0. 0.0 1 4 
0.0 0 0-0 


26. 


27. 


28. 


29. 


30. 


A CERA 8 
3 1 3 0 2 
A=]o 3 9 -1 4 
6 3 9 2 6 
a 0 6 
0 2 6 4 
o o0 0 -i 2 
o o0 0 0 


Construya una matriz A de 3 x 3 y un vector b diferente de 
cero en forma tal que b esté en Col A, pero b no sea igual que 
alguna de las columnas de A. 


Construya una matriz A de 3 x 3 y un vector b en forma tal 
que b no esté en Col A. 


Construya una matriz A de 3 x 3 no nula y un vector b diferente 
de cero en forma tal que b esté en Nul A. 


Suponga que las columnas de una matriz A = [a; =: ap] son 
linealmente independientes. Explique por qué (a;,..., a,) es 
una base para Col A. 


En los ejercicios 31 a 36, responda de manera tan amplia como sea 
posible y justifique sus respuestas. 


31. 


32. 


33. 


36. 


Suponga que F es una matriz de 5 x 5 cuyo espacio columna no 
es igual a R$. ¿Qué se puede decir acerca de Nul F? 


Si B es una matriz de 7 x 7 y Col B = R”, ¿qué se puede decir 
acerca de las soluciones de las ecuaciones de la forma Bx = b 
para b en R7? 





Si C es una matriz de 6 x 6 y Nul C es el subespacio cero, 
¿qué se puede decir acerca de las soluciones a ecuaciones de 
la forma Cx = b para b en R? 


. ¿Qué se puede decir acerca de la forma de una matriz A de 


m x n cuando las columnas de A forman una base para R”? 


. Si B es una matriz de 5 x 5 y Nul B no es el subespacio cero, 


¿qué se puede decir acerca de Col B? 


¿Qué se puede decir acerca de Nul C cuando C es una matriz de 
6 x 4 con columnas linealmente independientes? 


[M] En los ejercicios 37 y 38, construya bases para el espacio colum- 
na y para el espacio nulo de la matriz A dada. Justifique su trabajo. 


37. 


38. 


3-5 0 -l 3 
E ISAAA g 


ARIRE a e 
33 4 0 
5. 3 2-6 -8 
ds A DAN 


5 1 4 5 19 
Hf SR E g 


Espacio columna y espacio nulo 
Una base para Col A 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 
1. Para determinar si u está en Nul A, simplemente calcule 


LL. .3 —7 0 
Au = 2.0 7 3|=|0 
=3. =3: =3 2 0 


El resultado indica que u está en Nul A. Para decidir si u está en Col A se requiere más 
trabajo. Reduzca la matriz aumentada [A u] a la forma escalonada para determinar si 
la ecuación Ax = u es consistente: 


1 -1 5 -7 1 -1 5 -7 1-1) 5 —7 
2.07 3|=|0 2 3 I1I7|=|0 2 3 17 
3 -5-3 2 0 —8 12 —19 0 0 0 49 


La ecuación Ax = u no tiene solución, por lo tanto, u no está en Col A. 


2. En contraste con el problema de práctica 1, encontrar un vector en Nul A requiere más 
trabajo que probar si un vector específico está en Nul A. Sin embargo, como A ya está en 
forma escalonada reducida, la ecuación Ax = 0 indica que si x = (x1, x2, x3), entonces 
x2 = 0, x3 = 0, y xı es una variable libre. Por lo tanto, una base para Nul A es v = (1, 
0, 0). Encontrar solo un vector en Col A es trivial, puesto que cada columna de A está 
en Col A. En este caso particular, el mismo vector v se encuentra tanto en Nul A como en 
Col A. Para la mayoría de las matrices de n x n, el vector cero de R” es el único vector 
que se encuentra tanto en Nul A como en Col A. 


3. Si A es invertible, entonces las columnas de A generan R”, de acuerdo con el teorema 
de la matriz invertible. Por definición, las columnas de cualquier matriz siempre gene- 
ran el espacio columna, así que, en este caso, Col A es toda de R”. En forma simbólica, 
Col A = R”. Además, como A es invertible, la ecuación Ax = 0 tiene únicamente la 
solución trivial. Esto significa que Nul A es el subespacio cero. En forma simbólica, 
Nul A= {0}. 


2.9 | DIMENSIÓN Y RANGO 


En esta sección se continúa el análisis de los subespacios y las bases para subespacios comen- 
zando con el concepto de un sistema coordenado. La definición y el ejemplo presentados a 
continuación pretenden que un término nuevo y útil, dimensión, parezca bastante natural, al 
menos para los subespacios de IR, 


Sistemas coordenados 


La razón principal para seleccionar la base de un subespacio H, en lugar de simplemente un 
conjunto generador, es que cada vector en H se puede escribir solo de una manera como com- 
binación lineal de los vectores de la base. Para ver por qué, suponga que B = (b,,..., b,) es 
una base de H, y que un vector x en H se puede generar de dos maneras, por ejemplo, 


x = cıbı + es deby y x = d¡b; + e + dbp (1) 
Después, al restar se obtiene 
0=x-x= (cı —dı)bı + + (cp — dp)bp (2) 


Como B es linealmente independiente, los pesos en (2) deben ser todos cero. Es decir, cj = dj 
para 1 S ¡ = p, lo que indica que las dos representaciones en (1), en realidad, son iguales. 
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Suponga, que el conjunto 5 = (b,,..., b,] es la base de un subespacio H. Para cada 
x en H, las coordenadas de x respecto de la base B son los pesos c;,..., Cc, tales 
que x = cıbı + + + cpbp, y el vector en R? 


C1 
[x]g S 
Cp 


se llama vector de coordenadas de x (respecto de B) o vector de B-coordenadas 
de x.! 


3 —1 3 
EJEMPLO 1 Sea vı = | 6 |, v = 0|,x=| 12 | y B = [v,, vaz). Entonces B 
2 1 7 


es una base de H = Gen [v;, v2) porque v; y va son linealmente independientes. Determine 
si x está en H y, si lo está, encuentre el vector de coordenadas de x respecto de B. 


SOLUCIÓN Si x está en H, entonces la siguiente ecuación vectorial es consistente: 


3 -1 3 
cil 6|+<« 0|=|12 
2 1 7 


Los escalares cı y c2, si existen, son las B-coordenadas de x. Usando operaciones de fila, 
se tiene que 


3l 3 1 0 2 
6 0 12|=|0 1 3 
2 1 7 0. 0.0 


2 ¿ : 
3 | La base B determina un “sistema de coordena- 


das” en H, lo que puede visualizarse por medio de la malla que se ilustra en la figura 1. E 


Por lo tanto, cy = 2, c2 = 3 y [x]; = | 





FIGURA 1 Un sistema de coordenadas sobre un 
plano H en R?. 


1 Es importante que los elementos de B estén numerados, ya que las entradas de [x] dependen del orden de los 
vectores en B. 
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DEFINICIÓN 
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Observe que a pesar de que los puntos de H también se encuentran en R?, están comple- 
tamente determinados por sus vectores de coordenadas, los cuales pertenecen a R?. La malla 
en el plano de la figura 1 hace que A “se vea” como R?. La correspondencia x > [x]g es una 
correspondencia uno a uno entre H y R? que conserva las combinaciones lineales. A una co- 
rrespondencia de este tipo se le llama isomorfismo, y se dice que H es isomorfo a R?. 

En general, si B = {b;,..., bp} es una base para H, entonces el mapeo x > [Xx] g es una co- 
rrespondencia uno a uno que permite a H verse y actuar igual que R? (aunque los propios vec- 
tores de H puedan tener más de p entradas). (En la sección 4.4 se presentan más detalles). 


Dimensión de un subespacio 


Es posible demostrar que si un subespacio A tiene una base de p vectores, entonces cualquier 
base de H debe consistir en exactamente p vectores. (Véase los ejercicios 27 y 28). Por lo 
tanto, la siguiente definición tiene sentido. 


La dimensión de un subespacio AH diferente de cero, que se denota mediante dim AH, es 
el número de vectores en cualquier base para H. La dimensión del subespacio cero [0] 
es, por definición, cero.? 


El espacio R” tiene dimensión n. Cada base para R” consiste en n vectores. Un plano 
a través de 0 en R? es bidimensional, y una recta que pasa a través de 0 es unidimensional. 


EJEMPLO 2 Recuerde que el espacio nulo de la matriz A vista en el ejemplo 6, sección 
2.8, tenía una base de tres vectores. Así que la dimensión de Nul A en este caso es 3. Observe 
cómo cada vector básico corresponde a una variable libre en la ecuación Ax = 0. La cons- 
trucción realizada aquí siempre produce una base de este modo. Así, para encontrar la dimen- 
sión de Nul A, basta con identificar y contar el número de variables libres en Ax = 0. E 


El rango de una matriz A, que se denota como rango A, es la dimensión del espacio 
columna de A. 


Puesto que las columnas pivote de A forman una base para Col A, el rango de A es sim- 
plemente el número de columnas pivote en A. 


EJEMPLO 3 Determine el rango de la matriz 


2. 5-3-4 8 
4 7—4 3 9 
A=] 6 9-5 2 4 
0-9 6 5-6 


SOLUCIÓN Reduzca A a la forma escalonada: 


2 DO, HA 8 2.53 -4 8 
A 03 2 S =F p 0 3n 2 I eT 
0-6 4 14 20 0.0 0 4-6 
0-9 6 5 —6 0.0. 0 0.0 
Columnas pivote A+ 4 
La matriz A tiene 3 columnas pivote, así que rango A = 3. E 


2 El subespacio cero no tiene base (porque el vector cero forma, por sí mismo, un conjunto linealmente depen- 
diente). 
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TEOREMA 15 


TEOREMA 


La reducción por filas del ejemplo 3 revela que hay dos variables libres en Ax = 0, por- 
que dos de las cinco columnas de A no son columnas pivote. (Las columnas que no son pivote 
corresponden a las variables libres de Ax = 0). Como el número de columnas pivote más el 
número de columnas que no son pivote es exactamente el número de columnas, las dimensio- 
nes de Col A y Nul A guardan la siguiente relación útil. (Para más detalles, véase el teorema 
del rango en la sección 4.6). 


El teorema del rango 


Si una matriz A tiene n columnas, entonces rango A + dim Nul A = n. 


El siguiente teorema es importante para las aplicaciones y se necesitará en los capítulos 
5 y 6. El teorema (demostrado en la sección 4.5) es verdaderamente superior, si se piensa en 
un subespacio p-dimensional como isomorfo a RP. El teorema de la matriz invertible estable- 
ce que p vectores de R son linealmente independientes si y solo si también generan a R. 


El teorema de la base 


Sea H un subespacio p-dimensional de R”. Cualquier conjunto linealmente indepen- 
diente de exactamente p elementos en H de forma automática es una base de H. Ade- 
más, cualquier conjunto de p elementos de H que genere a H es automáticamente una 
base para H. 


Rango y el teorema de la matriz invertible 


Los diversos conceptos de espacio vectorial asociados con una matriz proporcionan varios 
enunciados más para el teorema de la matriz invertible. Estos enunciados se presentan como 
una continuación del teorema original presentado en la sección 2.3. 


El teorema de la matriz invertible (continuación) 


Sea A una matriz de n x n. En tal caso, cada uno de los siguientes enunciados es equi- 
valente al enunciado de que A es una matriz invertible. 


m) Las columnas de A forman una base de R”. 
n) Col A = R” 

o) dim Col A =n 

p) rangoA =n 

q) NulA = {0} 

r) dim Nul A = 0 


DEMOSTRACIÓN EIl enunciado m) es, por lógica, equivalente a los enunciados e) y h) que 
consideran independencia lineal y generación. Los otros cinco enunciados se vinculan a los 
primeros del teorema por medio de la siguiente cadena de implicaciones casi triviales. 


g&)=>n)=>0)>p)>r)>q)= d) 


El enunciado g), que establece que la ecuación Ax = b tiene al menos una solución para cada 
b en R”, implica al enunciado n), porque Col A es precisamente el conjunto de todas las b 
tales que la ecuación Ax = b sea consistente. Las implicaciones n) = 0) = p) se desprenden 
de las definiciones de dimensión y rango. Si el rango de A es n, el número de columnas de A, 
entonces dim Nul A = 0, de acuerdo con el teorema del rango, y así Nul A = {0}. Por lo tanto, 
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p) = r) > q). Además, el enunciado q) implica que la ecuación Ax = 0 tiene únicamente la 
solución trivial, que es el enunciado d). Puesto que ya se sabe que los enunciados d) y g) son 
equivalentes al enunciado de que A es invertible, la prueba está completa. E 





NOTAS NUMÉRICAS 


Muchos de los algoritmos analizados en este libro resultan útiles para entender concep- 
tos y realizar a mano cálculos sencillos. Sin embargo, con frecuencia los algoritmos no 
son aplicables a problemas de gran escala en la vida real. 

Un buen ejemplo de lo anterior es la determinación del rango. Tal vez parezca 
sencillo reducir una matriz a su forma escalonada y contar los pivotes. Pero, a menos 
que se realicen cálculos matemáticos precisos sobre una matriz cuyas entradas estén 
especificadas de manera exacta, las operaciones de fila pueden cambiar el rango apa- 


5 7 
rente de una matriz. Por ejemplo, si el valor de x en la matriz | 5 | no se almace- 


na exactamente como 7 en una computadora, entonces el rango puede ser 1 o 2, depen- 
diendo de si la computadora considera a x — 7 como cero. 

En las aplicaciones prácticas, es frecuente que el rango efectivo de una matriz A 
se determine a partir de la descomposición del valor singular de A, que se estudiará en 
la sección 7.4. 


PROBLEMAS DE PRÁCTICA 


1. Determine la dimensión del subespacio H de R? generado por los vectores V1, V2 Yy V3, 


(Primero, encuentre una base para H). 


2 3 -1 
v = —8 > V = —7 ý V3 = 6 
6 -1 7 


Considere la base 


para R°. Si [x]; = [| aus es x? 


3. ¿Podría R* contener un subespacio cuatridimensional (o tetradimensional)? Explique su 


respuesta. 


2.9 EJERCICIOS 


En los ejercicios 1 y 2, encuentre el vector x determinado por el vec- 
tor de coordenadas [x] yz y la base BB dados. Ilustre cada respuesta con 
una figura, como en la solución al problema de práctica 2. 


o s= [iLa E] 
AA 


En los ejercicios 3 a 6, el vector x está en un subespacio H con una 
base B = (b1, b>). Encuentre el vector de B-coordenadas de x. 


2 zj 0 
m=|_3]m=["5|=-[;] 
1 2 1 
vlije- 
1 -2 2 
.bi=| 4|b,=|-7|x=| 9 
9 5 2i 
-3 7 5 
. bı 2 |b =| -3 |x=| 0 
—4 5 =2 
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v- [iJe [e-a] > 


B = (b;, b>). Use la figura para estimar [w]x y [x]»y. Confir- 
me su estimación de [x]g usándola junto con {b;, b2} para 
calcular x. 


7. Sean 


b| 


=] 


AA 
[p si e] e 


z= E | y B = {bı, b2}. Use la figura para estimar 





8. Sean 


=2.5 


[x]s, lyls y [zls5. Confirme sus estimaciones de [yly y [zly 
usándolas junto con (by, b,) para calcular y y z. 





En los ejercicios 9 a 12 se presenta una matriz A y una forma escalo- 
nada de A. Encuentre bases para Col A y Nul A, y después establezca 
las dimensiones de estos subespacios. 
2 
3] 
5 


E ed 5 [o 
3 9 1 5 0 
a E A A No 


5 15 0 14 | Lo 


Oooow 
OOou Mu 


0 
1 -2 -1 5 4 
2 -1 1 5 6 

10. A=] > o2 1 6 
Fa a 005 


ooo»-— 
o 

oo—r— 
Ooron 
RR Ouo 


A ES E 
A AS 
0 


MES 0.9 0 9 
2g E Ee 23 A 


1 2 -5 1 —4 
0.0 5 0 5 
0. 0 0 0.0 
0.0 0 0.0 
1. 2-4 4 6 
5 1-9 2 10 
12. A=|4 6 -9 12 15 
3. 4-5 8 9 
1 2 8 4-6 
0 2 3 4-1 
0.0 5 0-5 
0.0 0 0.0 


En los ejercicios 13 y 14, encuentre una base para el subespacio que 
generan los vectores dados. ¿Cuál es la dimensión del subespacio? 


1 a | o —4 
13. =3 9 -1 5 


2|P|-6|]| 4 || -3 
—4 12 2 7 


1 2 0 -1 3 

-1 -3 -1 4 —7 

14. -2 P| -1 l’ 3pP 7 | 6 
3 4 =2 7 —9 


15. Suponga una matriz A de 4 x 6 tiene cuatro columnas pivote. 
¿Es Col A = R*? ¿Es Nul A = R?? Explique sus respuestas. 


16. Suponga una matriz A de 4 x 7 tiene tres columnas pivote. ¿Es 
Col A = R3? ¿Cuál es la dimensión de Nul A? Explique sus 
respuestas. 


En los ejercicios 17 y 18, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. Aquí A es una matriz de m x n. 


17. a) Si B = {v;, ..., Vp} es una base para un subespacio H, y si 
X = C1V1 + + + CpVp, entonces c1,..., Cp son las coordena- 
das de x respecto de la base B. 


b) Cada recta en R” es un subespacio unidimensional de R”. 


c) La dimensión de Col A es el número de columnas pivote 
de A. 


d) Las dimensiones de Col A y Nul A suman el número de co- 
lumnas de A. 


e) Si un conjunto de p vectores generan un subespacio p-di- 
mensional H de R”, entonces estos vectores forman una base 
para H. 


18. a) Si B es una base para un subespacio H, entonces cada vector 
en H se puede escribir solamente de una forma como combi- 
nación lineal de los vectores en B. 


b) La dimensión de Nul A es el número de variables en la ecua- 
ción Ax = 0. 


c) La dimensión del espacio columna de A es rango A. 


d) Si B = {v1,..., Vp} es una base del subespacio H de R”, 
entonces la correspondencia x > [x]g hace que H sea vea 
y actúe como RP. 

e) Si H es un subespacio p-dimensional de R”, entonces un con- 
junto linealmente independiente de p vectores en H es una 
base para H. 


En los ejercicios 19 a 24 justifique cada respuesta o construcción. 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


Si el subespacio de todas las soluciones de Ax = 0 tiene una 
base que consiste en tres vectores, y si A es una matriz de 5 x 7, 
¿cuál es el rango de A? 


¿Cuál es el rango de una matriz de 6 x 8 cuyo espacio nulo es 
tridimensional? 


Si el rango de una matriz A de 9 x 8 es 7, ¿cuál es la dimensión 
del espacio solución de Ax = 0? 


Demuestre que un conjunto [v;,..., v5) en R” es linealmente 
dependiente si dim Gen {vV1,..., V5} = 4. 


Si es posible, construya una matriz A de 3 x 5 tal que dim 
Nul A = 3 y dim Col A = 2. 


Construya una matriz de 3 x 4 con rango 1. 


Sea A una matriz de n x p cuyo espacio columna es p-dimensio- 
nal. Explique por qué las columnas de A deben ser linealmente 
independientes. 


Suponga que las columnas 1, 3, 4, 5 y 7 de una matriz A son 
linealmente independientes (pero no son necesariamente co- 
lumnas pivote), y que el rango de A es 5. Explique por qué las 
cinco columnas mencionadas deben ser una base para el espacio 
columna de A. 


27. 


28. 


29. 


30. 
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Suponga que los vectores b;,..., b, generan un subespacio W, 
y sea (a1,..., ag} cualquier conjunto en W que contenga más de 
p vectores. Complete los detalles del siguiente argumento para 
demostrar que {a;,..., ay) debe ser linealmente dependiente. 
Primero, sea B = [bj b] yA = [a >} aq]. 


a) Explique por qué para cada vector a;, existe un vector e; en 
R? tal que a; = Bc. 

b) Sea C = [ej c4]. Explique por qué existe un vector 
diferente de cero tal que Cu = 0. 


c) Utilice B y C para demostrar que Au = 0. Esto muestra que 
las columnas de A son linealmente dependientes. 


Use el ejercicio 27 para demostrar que si A y B son bases 
para un subespacio W de R”, entonces A no puede contener 
más vectores que B y, a la inversa, que B' no puede conte- 
ner más vectores que A. 


[M] Sean A = Gen [vi, va), y B = (vi, v2). Demuestre que 
x está en H, y encuentre el vector de B-coordenadas de x, 
cuando 


15 14 16 
a =5 sE —10 De 0 
12 |” 13 |” 11 
7 17 =3 


[M] Sean H = Gen {v1, v2, v3} y B = ([vi, va, v3). Demuestre 
que B es una base para H y que x está en H, y encuentre el vec- 
tor de B-coordenadas de x, cuando 


—6 8 —9 11 

3 0 4 -2 

Ml E A 7prY=|_3p*=]| 17 
4 =3 3 =8 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Construya A = [v; v2 v3] de manera que el subespacio generado por V1, V2, V3 sea el espa- 
cio columna de A. Las columnas pivote de A proporcionan una base para este espacio. 


2 
—8 
6 


A= 


3 
—7 
-1 


-1 


7 


2 3-1 2. 3-1 
6|=|0 535 2|=]0 5 
0—10 —4 0 0 0 


Las primeras dos columnas de A son columnas pivote y forman una base para H. Por lo 


tanto, dim H = 2. 





básicos usando los pesos 3 y 2: 


1 2 3.4 
somaa] iaf] 2] 


La base (b,, b2} determina un sistema de coordenadas para R?, que se ilustra con la 


; 3 y CRA 
2. Si [x]g = E | entonces x se forma a partir de una combinación lineal de los vectores 


malla de la figura. Observe cómo x tiene 3 unidades en la dirección b, y 2 unidades en 








1 la dirección b>. 
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3. Un subespacio cuatridimensional contendría una base de cuatro vectores linealmente in- 
dependientes. Esto es imposible en [R3. Como cualquier conjunto linealmente indepen- 
diente en R? no contiene más de tres vectores, cualquier subespacio de R? tiene una di- 
mensión no mayor a 3. El propio espacio [R? es el único subespacio tridimensional de R°. 
Los otros subespacios de R? tienen dimensión 2, 1 o 0. 


CAPÍTULO 2 EJERCICIOS COMPLEMENTARIOS 


1. 


. Encuentre la matriz C cuya inversa es C7! = 


. Sea A= |1 0 


Suponga que las matrices mencionadas en los siguientes enun- 
ciados tienen los tamaños adecuados. Marque cada enunciado 
como verdadero o falso. Justifique sus respuestas. 


a) Si A y B son de m x n, entonces tanto ABT como ATB están 
definidas. 


b) Si AB = C y C tiene dos columnas, entonces A tiene dos 
columnas. 


c) Al multiplicar por la izquierda una matriz B por una matriz 
diagonal A, con entradas distintas de cero en la diagonal, se 
modifica la escala de las filas de B. 


d) Si BC = BD, entonces C = D. 
e) Si AC = 0, entonces A = 00o C = 0. 
f) SiA y Bson den x n, entonces (A + BXA — B) = A? — B?. 


g) Una matriz elemental de n x n tiene no n + 1 entradas 
diferentes de cero. 


h) La transpuesta de una matriz elemental es una matriz ele- 
mental. 


i) Una matriz elemental debe ser cuadrada. 


j) Toda matriz cuadrada es un producto de matrices elemen- 
tales. 


k) Si A es una matriz de 3 x 3 con tres posiciones pivote, exis- 
ten matrices elementales E;,..., E, tales que E, -** E¡A = 1. 


D SiAB = I, entonces A es invertible. 


m) Si A y B son cuadradas e invertibles, entonces AB es inverti- 
ble, y (AB)! =A71B"! 


n) Si AB = BA y A es invertible, entonces A7 1B = BA™!. 


0) Si A es invertible y r + 0, entonces (rA)7! = rA7!, 
1 
p) Si A es una matriz de 3 x 3 y la ecuación Ax = | 0 
0 


4 5 
6 1f 
o 0 0 


0 |. Demuestre que A? = 0. Utilice álge- 
0 1 0 


bra de matrices para calcular el producto (1 — AJU +A + 42). 


tiene 


una sola solución, entonces A es invertible. 


. Suponga que A” = 0 para alguna n > 1. Encuentre una inversa 


para I — A. 


. Suponga que una matriz A de n x n satisface la ecuación 


A? — 2A + I = 0. Demuestre que A? = 3A — 21, y que A4 = 
4A — 31. 


10. 


11. 


12. 


1 0 0 1 > 
Sea Á = ls 1 | B= la Al Estas son matrices de 


espín de Pauli y se usan en el estudio del espín de electrones en 


mecánica cuántica. Demuestre que A? = I, B? = I y AB = —BA. 
Las matrices del tipo AB = —BA se llaman anticonmutativas. 
1 3 8 -3 5 
Sea A=|2 4 11|yB= 1 5 |. Calcule A7!B 
Lo 2 3 3 4 


sin calcular A7!, [Sugerencia: A7!B es la solución de la ecua- 
ción AX = B]. 


Encuentre una matriz A tal que la transformación x > AX 


1 2 1 3 a 
mapee [3 |Y [| M[ ¡[Y [1 p respectivamente. [Suge- 


rencia: Escriba una ecuación de matrices que implique a A, y 
despeje A]. 


5 4 7" 3 
2 3 | yB = |; 1 | Encuentre A. 


Suponga que A es invertible. Explique por qué ATA también es 
invertible. Después demuestre que A7! = (ATA) 1AT. 


Suponga que AB = | 


Sean x1,..., Xn números fijos. La siguiente matriz, llamada una 
matriz de Vandermonde, se presenta en aplicaciones como pro- 
cesamiento de señales, códigos correctores de errores e interpo- 
lación de polinomios. 


2 n—1 

1 x x +. XI 
loa xo xl 

V = i a 
2 n—1 

Lo Sm X pia e 


A partir de y = (y1,..-, Yn) en R”, suponga que € = (co,..., Cn-1) 
en R” satisface Ve = y, y defina el polinomio 


pÀ = co + cit + cat? + e + Cat”! 





a) Demuestre que p(x1) = y1,..., P(Xn) = Yn. Denominamos a 
p(t) un polinomio de interpolación para los puntos (X;, y1),..., 
(Xn, Yn) porque la gráfica de p(t) pasa por estos puntos. 


b) Suponga que x1,..., Xn son números distintos. Demuestre que 
las columnas de V son linealmente independientes. [Suge- 
rencia: Piense en cuántos ceros puede tener un polinomio de 
grado n — 1]. 

c) Demuestre que: “Si x;,..., X,, son números distintos yj,..., 
y, Son números arbitrarios, entonces hay un polinomio de 
interpolación de grado < n — 1 para (x1, y1),..., Xn Yn”. 


Sea A = LU, donde L es una matriz triangular inferior invertible 
y U es triangular superior. Explique por qué la primera columna 
de A es un múltiplo de la primera columna de L. ¿Cómo se rela- 
ciona la segunda columna de A con las columnas de L? 


13. 


14. 


Dada u en R” con ufu = 1, sea P = uu” (un producto exterior) 
y Q = 1 — 2P. Justifique los enunciados a), b) y c). 


a) P =P b) PT=P cd) Q =I 


La transformación x +> Px es una proyección, y X > QX se 
llama reflexión de Householder. Dichas reflexiones se usan 
en programas de computadora para crear múltiples ceros en un 
vector (por lo general, una columna de una matriz). 


1 
5 |. Determine P y Q como en el 


0 
Sean u= | 0 | y x= 
1 3 


ejercicio 13, y calcule Px y Ox. La figura muestra que Ox es 
la reflexión de x a través del plano xıx2. 








i 
i l 
Sol E 
Una reflexión de Householder a través del 
plano x3 = 0. 


15. 


16. 


17. 


18. 


19. 


20. 
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Suponga que C = EzE>E¡B, donde E, E, y Ez son matrices 
elementales. Explique por qué C es equivalente por filas a B. 


Sea A una matriz singular de n x n. Describa cómo se puede 
construir una matriz B de n x n no mula tal que AB = 0. 


Sean A una matriz de 6 x 4 y B una matriz de 4 x 6. Demuestre 
que la matriz AB de 6 x 6 no puede ser invertible. 


Suponga que A es una matriz de 5 x 3 y que existe una matriz 
Cde 3 x 5 tal que CA = I. Suponga además que para alguna b 
dada en R5, la ecuación Ax = b tiene por lo menos una solución. 
Demuestre que esta solución es única. 


[M] Ciertos sistemas dinámicos se pueden estudiar examinan- 
do las potencias de una matriz, como las que se presentan a 
continuación. Determine qué ocurre a A* y B* conforme k se 
incrementa (por ejemplo, pruebe con k = 2,..., 16). Trate de 
identificar qué tienen de especial A y B. Investigue potencias 
grandes de otras matrices de este tipo y haga una conjetura acer- 
ca de dichas matrices. 


4 2 3 Or 2” uko 
A=|.3 6 3|, B=|.1 6 3 
0 ZA 2. 2 4 


[M] Sea A, una matriz de n x n con ceros en la diagonal prin- 
cipal y números 1 en el resto. Calcule A7! para n = 4, 5 y 6, 
y haga una conjetura acerca de la forma general de A7! para 
valores más grandes de n. 
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Determinantes 


EJEMPLO INTRODUCTORIO 


Trayectorias aleatorias y distorsión 


En su libro autobiográfico ¿Está usted de broma, Sr. Feynman?, 
el Premio Nobel de Física 1965, Richard P. Feynman, comen- 
ta que en su estancia universitaria de posgrado en Princeton 
solía observar a las hormigas. Estudió su comportamiento al 
proporcionarles un “transbordador” de pedazos de papel que 
podía trasladarlas hacia el terrón de azúcar que colgaba de 
una cuerda, donde las hormigas jamás podrían encontrarlo 
accidentalmente. Cuando una hormiga se paraba sobre el 
papel, entonces Feynman la transportaba hacia la comida 

y la traía de regreso al punto inicial. Después de que las 
hormigas aprendieron a utilizar el transbordador de papel, 
Feynman reubicó el punto de aterrizaje de retorno. Esto 
pronto generó confusión en la colonia de hormigas, lo que 
indicaba que el “aprendizaje” de las hormigas había consisti- 
do en crear y seguir rutas. Feynman confirmó esta conjetura 
colocando placas de vidrio sobre el piso. Una vez que las hor- 
migas establecieron rutas sobre los trozos de vidrio, Feynman 
los reacomodó y, por consiguiente, las rutas que estos indi- 
caban. Las hormigas siguieron las rutas reposicionadas y así 
Feynman podía dirigir a las hormigas adonde él quisiera. 


Supongamos que Feynman hubiera deseado realizar investi- 
gaciones adicionales utilizando un globo, fabricado con una malla 
de alambre; las hormigas deberían seguir cada alambre y elegir 
entre dirigirse a la izquierda o a la derecha en cada intersección. 
Si varias hormigas y un número igual de fuentes de alimento se 
colocan sobre el globo, ¿qué tan probable sería que cada hormiga 
encontrara su propia fuente de alimento en lugar de utilizar la ruta 
de otra hormiga y seguirla hasta una fuente compartida? 


l La solución al problema de la trayectoria de las hormigas (y otras dos aplica- 
ciones) se puede encontrar en el artículo de Arthur Benjamin y Naomi Came- 
ron, publicado en la edición de Mathematical Monthly, de junio 2005. 








Para registrar las rutas reales de las hormigas y 
comunicar los resultados a otros, es conveniente utilizar 
un mapa rectangular del globo. Existen muchas maneras 
de trazar dichos mapas. Una manera sencilla es utilizar la 
latitud y longitud sobre el globo como coordenadas x y y 
en el mapa. Como ocurre con todos los mapas, el resultado 
no sería una representación totalmente fiel del globo. 

Los detalles cerca del “ecuador” se ven prácticamente 
iguales tanto sobre el globo como en el mapa, pero 

las regiones cercanas a los “polos” del globo están 
distorsionadas. Las imágenes de regiones polares son 
mucho más grandes que las imágenes de regiones 
ecuatoriales de tamaño similar. Para ajustarse a sus 
alrededores en el mapa, la imagen de una hormiga cerca 
de uno de los polos debería ser más grande que la de una 
cercana al ecuador. ¿Cuánto más de grande? 


De manera sorprendente, los problemas de la trayec- 
toria de las hormigas y la distorsión del área se contestan 
mejor utilizando determinantes, el tema de este capítulo. 

De hecho, el determinante tiene tantos usos que un resumen 
de sus aplicaciones a principios del siglo xx ocupó cuatro 
volúmenes del tratado que escribió Thomas Muir. Ante la 
trascendencia y el tamaño crecientes de las matrices en las 
aplicaciones modernas, muchos usos de los determinantes 
que antes eran importantes ahora ya no lo son. Sin embargo, 
los determinantes aún desempeñan un papel importante. 
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Además de introducir el tema de determinantes en la sección 3.1, este capítulo presenta dos 
ideas importantes. La sección 3.2 deduce, para una matriz cuadrada, un criterio de invertibili- 
dad que desempeña un papel importante en el capítulo 5. La sección 3.3 muestra cómo el de- 
terminante mide cuánto cambia una transformación lineal al área de una figura. Cuando esta 
técnica se aplica localmente, entonces se responde a la pregunta de la tasa de expansión de un 
mapa cerca de los polos. Esta idea desempeña un papel fundamental en cálculo multivariado 
en la forma del jacobiano. 


3.1 | INTRODUCCIÓN A LOS DETERMINANTES 


Recuerde de la sección 2.2 que una matriz de 2 x 2 es invertible si y solo si su determinante 
es diferente de cero. Para extender este útil resultado a matrices más grandes, se necesita una 
definición para el determinante de una matriz de n x n. Se puede descubrir la definición para 
el caso 3 x 3 observando qué ocurre cuando una matriz invertible A de 3 x 3 se reduce por 
filas. 

Considere A = [a;¡] con a1 + 0. Si la segunda y tercera filas de A se multiplican por a11, y 
luego se restan múltiplos adecuados de la primera fila de las otras dos filas, se encuentra que 
A es equivalente por filas a las dos matrices siguientes: 


411 412 413 411 a 413 
aj431 ada anaz |~| 0 ajar—aj243 411493 — 413421 (1) 
411431 411432 411433 0 411432 — 412431 411433 — 413031 


Puesto que A es invertible, entonces la entrada (2, 2) o la entrada (3, 2) en el lado derecho 
de (1) es diferente de cero. Supongamos que la entrada (2, 2) es diferente de cero. (De otra 
forma, se puede realizar un intercambio de filas antes de proceder). Se multiplica la fila 3 por 
411427 — 412471, y luego a la nueva fila 3 se le suma la fila 2 multiplicada por —(a11432 — 412431). 
Esto mostrará que 


a11 a12 413 
A=| 0 41142 — 412421 411423 — 413091 
0 0 ay A 


donde 
A = 411422433 + 412423431 + 413421432 — 411423432 — 412421433 — 413422431 (2) 


Puesto que A es invertible, A debe ser diferente de cero. En la sección 3.2 se verá que lo con- 
trario también es verdad. A A de la ecuación (2) se le llama el determinante de la matriz A 
de 3 x 3. 

Recuerde que el determinante de una matriz de 2 x 2, A = [a;j], es el número 


det A = 4114929 — 012091 


Para una matriz de 1 x 1, por ejemplo, A = [a;¡], se define det A = a;¡. Para genera- 
lizar la definición del determinante a matrices más grandes, se utilizarán determinantes de 
2 x 2 para rescribir el determinante A de 3 x 3 descrito anteriormente. Puesto que los tér- 
minos en Á se pueden agrupar como (a;¡¡ad7,433 — 411423432) — (417471433 — 412423431) + 
(413471432 — 413422431), 


422 423 421 423 421 422 
A = aji : det — a12 - det + 413 : det 
432 433 431 433 431 432 


Por brevedad, se escribe 
A = 411 : det A¡¡ — 412 : det A12 + a13 - det Á13 (3) 


donde Aj, A12 y Aj3 se obtienen de A eliminando la primera fila y una de las tres columnas. 
Para cualquier matriz cuadrada A, sea Aj la submatriz formada al eliminar la ¡-ésima fila y la 
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j-ésima columna de A. Por ejemplo, si 


1-2 5 0 
2 0 4-1 
Ala i 0 7 
0.42 0 


1 A 5 0 

2 E0 4 —1 

II O 

0.42 0 

de manera que 

1 5 0 
Ap=|2 4 -—1 
02 0 


Ahora se puede dar una definición recursiva de un determinante. Cuando n = 3, det A se 
define utilizando los determinantes de las submatrices Ay; de 2 x 2, como en la ecuación (3). 
Cuando n = 4, det A utiliza los determinantes de las submatrices Ay, de 3 x 3. En general, un 
determinante n x n se define mediante determinantes de submatrices de (n — 1) X (n — 1). 


Para n = 2, el determinante de una matriz A = [a¡¡] de n x n es la suma de n términos 
de la forma ta; det Ay;, con signos más y menos alternados, donde las entradas aj, 
412,..., 4], SON de la primera fila de A. En símbolos, 


det A = a der — aj det A; ta dera. 


n 
= Dooa det Ay; 
ol 


EJEMPLO 1 Calcule el determinante de 


1 5 0 
A=|2 4-1 
0—2 0 


SOLUCIÓN Calcule det A = a;ı det A1; — a12 det A12 + a13 det A13: 


4 —1 2 —l1 2 4 
dA = 1de] 3 ol- o | 0-00 [7 El 


= 1(0 — 2) — 5(0 — 0) + 0(—4 — 0) = -2 E 


Otra notación común para el determinante de una matriz utiliza un par de rectas verticales 
en lugar de corchetes. Así, el cálculo del ejemplo 1 se puede representar como 


4 —1 2 -1 2 3 


2 0 0o o0 E St 


rA = 1l -s 





Ed 


Para establecer el siguiente teorema, es conveniente escribir la definición de det A en 
una forma ligeramente distinta. Dada A = [aj;], el cofactor (i, j) de A es el número C;j 
definido por 

Ci; = 17 det Aj (4) 
Entonces 


det A = a411€11 + a42C12 +->**+41nCin 
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TEOREMA 1 


Esta fórmula se conoce como desarrollo por cofactores a lo largo de la primera fila 
de A. Se omite la demostración del siguiente teorema fundamental para así evitar una larga 
digresión. 


El determinante de una matriz A de n x n se puede calcular mediante un desarrollo por 
cofactores a lo largo de cualquier fila o columna. El desarrollo a lo largo de la ¡-ésima 
fila utilizando los cofactores de la ecuación (4) es 


detA = aC; + apCi +: + AinCin 
El desarrollo por cofactores a lo largo de la j-ésima columna es 


det A = ajCi; + 49Coj + *** + ArjCoj 


El signo más o menos en el cofactor (i, j) depende de la posición de a, en la matriz, sin 
importar el signo de a. El factor (—1)'*/ genera el siguiente patrón de signos: 


+ — + 
= + = 
+ — + 


EJEMPLO 2 Utilice un desarrollo por cofactores a lo largo de la tercera fila para calcular 
el det A, donde 


1 5 0 
A=|2 4 -l 
0-2 0 
SOLUCIÓN Calcule 
det A = a31C31 + a32C32 + 433C33 
= ED as det Az, + ias det A32 + (1) ta33 det Az 


5 0 1 0 1 5 
so PEO +0 
=0+2(-1)+0=-2 m 


El teorema 1 es útil para calcular el determinante de una matriz que contiene muchos 
ceros. Por ejemplo, si en una fila hay una mayoría de ceros, entonces el desarrollo por co- 
factores a lo largo de esa fila tiene muchos términos iguales a cero, y no se necesita calcular 
los cofactores en estos términos. El mismo enfoque funciona con una columna que contiene 
muchos ceros. 


EJEMPLO 3 Calcule det A, donde 


3-7 8 9 -—6 
0. 2-5 7 3 
A=|0 0 1 5 0 
0 0 2 4-1 
0 0 0-2 0 


SOLUCIÓN El desarrollo por cofactores a lo largo de la primera columna tiene todos los 
términos iguales a cero, excepto el primero. Así, 


2-5 7 3 
0 1.5 0 

det A = 3. 0.2 4-1 — 0- Ca, + 0- C31 — 0- C4 +0- C51 
0o 0—2 0 
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De aquí en adelante se omitirán los términos iguales a cero en el desarrollo por cofactores. 
Después, desarrolle este determinante de 4 x 4 a lo largo de la primera columna para tomar 
ventaja de los ceros que están ahí. Se tiene 


1 5 0 
detA=3-2-|2 4 —1 
0-2 0 


Este determinante de 3 x 3 se calculó en el ejemplo 1 y se encontró que su valor es —2. 
Por lo tanto, det A = 3 ; 2 - (—2) = —12. E 


La matriz en el ejemplo 3 era casi triangular. El método en ese ejemplo se adapta fácil- 
mente para demostrar el siguiente teorema. 


TEOREMA 2 Si A es una matriz triangular, entonces det A es el producto de las entradas sobre la 
diagonal principal de A. 


La estrategia en el ejemplo 3 para detectar ceros funciona muy bien cuando una fila o 
columna completa consiste en ceros. En tal caso, el desarrollo por cofactores a lo largo de tal 
fila o columna jes una suma de ceros! Así, el determinante es cero. Por desgracia, la mayoría 
de los desarrollos por cofactores no son tan rápidos de evaluar. 


NOTA NUMÉRICA 





En la actualidad, una matriz de 25 x 25 se considera pequeña. Sin embargo, sería 
imposible calcular un determinante de 25 x 25 con un desarrollo por cofactores. En 
general, un desarrollo por cofactores requiere alrededor de n! multiplicaciones, y 25! 
es aproximadamente 1.5 x 10%. 


Si una computadora efectúa un billón de multiplicaciones por segundo, tendría que 
trabajar unos 500,000 años para calcular un determinante de 25 x 25 utilizando este 
método. Por fortuna, hay métodos más rápidos, como pronto se verá. 


Los ejercicios 19 a 38 exploran importantes propiedades de los determinantes, sobre todo 
para el caso de 2 x 2. Los resultados de los ejercicios 33 a 36 se utilizarán en la próxima 
sección con la finalidad de deducir propiedades análogas para matrices de n x n. 


PROBLEMA DE PRÁCTICA 


Iera A 2 

0.3 0-4 
Calcule =5 8 0 3| 

0. 5 0-6 


3.1 EJERCICIOS 


En los ejercicios 1 a 8 obtenga los determinantes utilizando un de- 


2-4 3 1 
sarrollo por cofactores a lo largo de la primera fila. En los ejercicios 3.13 1.2 4.12 1 1 
1 a 4, también calcule el determinante mediante un desarrollo por D el 3 
cofactores a lo largo de la segunda columna. 
3 0 4 0 5 1 3 -4 5-2 4 
1.2 3 2 2 14 3 0 5. |4 5 6. |0 3 —5 


0 5 -l NS 1 5 1 6 2 —4 7 
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4 3 0 8 1 6 
TE NO 2 8 ¡4 0 3 
9 7 3 A OS 


En los ejercicios 9 a 14 calcule los determinantes mediante desarro- 
llo por cofactores. En cada paso, seleccione una fila o columna que 
implique la menor cantidad de operaciones. 


6 0 0 5 lA 2 
P oR 2m5 0o 0 3 Ọ 
en 2.0. 0.0 17: 2 —=6 =7 5 
8 3 1 8 5 0 4 4 
3 5 -8 4 4 0o 0 
02 3 -—7 7-1 0.0 
a 0.0 1 5 E 2: 06 3-0 
0. 0 0 2 5 -8 4 -3 
4 07 3 -3 
0.0 2 0.0 
13. 7 3 —6 4 -8 
O AS 
0. 0 9-1. 2 
6 3 2 4 0 
9 0 —4 1 0 
14. |8 -5 6 7 1 
3 0 0 0 0 
As S2 ¿3 2 0 





El desarrollo de un determinante de 3 x 3 se puede recordar median- 
te el siguiente recurso. A la derecha de la matriz escriba una segunda 
copia de las primeras dos columnas, y calcule el determinante multi- 
plicando las entradas sobre las seis diagonales: 


41 % %43| 41 4% 
a “% “alt % 
43, %z “| 43 ly 
E Fa E 


Sume los productos de las diagonales hacia abajo y reste los pro- 
ductos de las diagonales hacia arriba. Utilice este método para ob- 
tener los determinantes en los ejercicios 15 a 18. Advertencia: Este 
truco no se generaliza de manera razonable a matrices de 4 x 4 
o mayores. 


3 0 4 0 5 1 
15. 12 3 2 16. |4 3 

0 5 -I 2 4 1 

2 -4 3 1 3 5 
17. 3 1 2 18. |2 1 1 

l1 4 -I zo 2 


En los ejercicios 19 a 24, explore el efecto de una operación elemen- 
tal de fila sobre el determinante de una matriz. En cada caso, esta- 
blezca la operación de fila y describa cómo afecta al determinante. 


a b c d a b a b 
13: E able a] D; k os sel 


21. 


a b a+kc b+kd 
aa [e apee a, 
1 k k k 
23. | — 4 |,| -3 8 —4 
2 2 3 2 
a b c 3 2 2 
24. | 3 2 2|,ja b c 
6 5 6 6 5 6 


En los ejercicios 25 a 30, calcule los determinantes de las matrices 


elementales dadas. (Véase la sección 2.2). 


1 0. 0 1 0 0 

25. | 0 1 0 26. | 0 1 0 
0 k 1 k 0 1 

k 0 0 1 o 0 

27. | 0 1 0 28. |0 k 0 
0 0 1 0o 0 1 

1 0 0 0 1 

29 |1 0 0 30. | 0 1 0 
0o 0 1 1 0 0 


Con base en los ejercicios 25 a 28, conteste las preguntas de los ejer- 
cicios 31 y 32. Exprese las razones de sus respuestas. 


31. ¿Cuál es el determinante de una matriz con remplazo elemental 
de fila? 


32. ¿Cuál es el determinante de una matriz de escalamiento elemen- 
tal con k en la diagonal? 


En los ejercicios 33 a 36, compruebe que det EA = (det E)(det A), 
donde E es la matriz elemental mostrada y A = | 4 b | 


c d 
0 1 
90 y 


1 0 

34. 1 kl 

1 k 1 0 

s[i] w[i 
37. saa =| 


a al Escriba 5A. ¿det 5A = 5 det A? 


38. Sean A = | a i | y k un escalar. Encuentre una fórmula que 


relacione al det kA con k y det A. 


En los ejercicios 39 y 40, A es una matriz de n x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 


39. a) Un determinante de n x n está definido por determinantes de 
submatrices de (n — 1) x (n — 1). 
b) El cofactor (i, j) de una matriz A es la matriz A;j obtenida al 
eliminar de A la i-ésima fila y la j-ésima columna. 


40. a) El desarrollo por cofactores de det A a lo largo de una co- 
lumna es el negativo del desarrollo por cofactores a lo largo 
de una fila. 


41. 


42. 


43. 


3.2 | PROPIEDADES DE LOS DETERMINANTES 


b) El determinante de una matriz triangular es la suma de las 
entradas sobre la diagonal principal. 


Sean u = | J y v= | f | Calcule el área del paralelogramo 


determinado por u, v, u + v y 0, y obtenga el determinante de 
[u v]. ¿Hay comparación entre ambos resultados? Remplace 
la primera entrada de v por un número arbitrario x, y repita 
el problema. Realice un esquema y explique lo que haya 
encontrado. 


a 


b 


simplificar). Calcule el área del paralelogramo definido por u, 
v, u + v y 0, y obtenga los determinantes de las matrices [u v] 
y [vu]. Realice un esquema y explique sus resultados. 


Sean u = | | y v= lo) donde a, b, c son positivos (para 


[M] ¿Es verdad que det(A + B) = det A + det B? Para ave- 
riguarlo, genere matrices aleatorias A y B de 5 x 5, y calcule 
det (A + B) — det A — det B. (Consulte el ejercicio 37 de la sec- 


44. 


45. 


46. 


3.2 Propiedades de los determinantes 169 


ción 2.1). Repita los cálculos para otros tres pares de matrices 
de n x n, con diversos valores de n. Informe sus resultados. 


[M] ¿Es cierto que det AB = (det A)(det B)? Experimente con 
cuatro pares de matrices aleatorias, como en el ejercicio 43, y 
haga una conjetura. 


[M] Construya una matriz aleatoria A de 4 x 4, con entradas en- 
teras entre —9 y 9, y compare det A con det AT, det(—A), det(2A) 
y det(10A). Repita el ejercicio con otras dos matrices aleatorias 
de 4 x 4, y haga conjeturas acerca de cómo se relacionan esos 
determinantes. (Véase el ejercicio 36 de la sección 2.1). Luego, 
compruebe sus conjeturas con varias matrices enteras aleatorias 
de 5 x 5 y de 6 x 6. Si es necesario, modifique sus conjeturas e 
informe sus resultados. 


[M] ¿Cómo se relaciona det A™! con det A? Experimente con 
matrices enteras aleatorias de n x n, para n = 4, 5 y 6, y haga 
una conjetura. Nota: En el improbable caso de que se encuentre 
con una matriz con determinante cero, redúzcala a una forma 
escalonada y analice su resultado. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Aproveche los ceros. Inicie con un desarrollo por cofactores a lo largo de la tercera columna 
para obtener una matriz de 3 x 3, que se puede evaluar con un desarrollo a lo largo de su 


primera columna. 


7 
0 3 
=5 -8 
0 5 


ooo 


E 0 3 —4 
a = (—1)!+32| -5 -8 3 
S 0 5-6 
3 -4 
— 3. (121 = 
=2-(-1) JE I 20 


El 1 en el penúltimo cálculo viene de la posición (2, 1) del —5 en el determinante 


de 3 x 3. 


El secreto de los determinantes reside en cómo cambian cuando se efectúan operaciones de 
fila. El siguiente teorema generaliza los resultados de los ejercicios 19 a 24 de la sección 3.1. 
La demostración se encuentra al final de esta sección. 


TEOREMA 3 


Operaciones de fila 


Sea A una matriz cuadrada. 


a) Si un múltiplo de una fila de A se suma a otra fila para producir una matriz B, enton- 


ces det B = det A. 


b) Si dos filas de A se intercambian para producir B, entonces det B = —det A. 


c) Si una fila de A se multiplica por k para producir B, entonces det B = k : det A. 


Los siguientes ejemplos muestran cómo utilizar el teorema 3 para calcular determinantes 


con eficiencia. 
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1 —4 2 
EJEMPLO 1 Calcule det A, donde A=|-2 8 —9 
-1 7 0 


SOLUCIÓN La estrategia es reducir A a una forma escalonada y luego utilizar el hecho de 
que el determinante de una matriz triangular es el producto de las entradas diagonales. Los 
primeros dos remplazos de fila en la columna 1 no alteran al determinante: 


1-4 2 1-4 2 1-4 2 
dtA=|-2 8 -—9|=| 0 0 -5|=/|0 0 —5 
-1 7 0 -1 7 0 0 3 2 


Un intercambio de las filas 2 y 3 invierte el signo del determinante, de manera que 
1 —4 2 
det4=-/0 3 2|=-(1)(3)(—5) = 15 E 
0 0 -5 


Un uso común del teorema 3c) en cálculos a mano es factorizar un múltiplo común de 
una fila de una matriz. Por ejemplo, 


* * * * o ko o * 
5k —2k  3k|=k|5 -2 
* * * xko ok ë 


donde las entradas con asterisco quedan inalteradas. Este paso se emplea en el siguiente 
ejemplo. 


2—8 6 8 
EJEMPLO 2 Calcule det A, donde A = k T S i 
1-4 0 6 


SOLUCIÓN Para simplificar la aritmética, se desea un 1 en la esquina superior izquierda. Se 
podrían intercambiar las filas 1 y 4. Pero, en vez de ello, se saca el factor 2 de la fila superior, 
y luego se procede con remplazos de fila en la primera columna: 


1-4 3 4 1 -4 3 4 
3—9 5 10 0 3 a4 2 
dt A=2_3 o 1 -2|5?lo -12 10 10 
1-4 0 6 0 0 3 2 


Después, se podría sacar otro factor 2 de la fila 3 o utilizar como pivote el 3 en la segunda co- 
lumna. Seleccionamos la última operación, sumando a la fila 3 la fila 2 multiplicada por 4: 


1-4 3 4 
0 3-4 -—2 
det A = 2 0 06 2 
0 0-3 2 


Por último, sumando la fila 3 multiplicada por —1/2 a la fila 4, y calculando el determinante 
“triangular”, se encuentra que 


4 
7| = 2: DOON = -36 s 
1 


E * * * 
0 n * * 
PU A n 
0 0 0 m 

det U + 0 
a * * * 
0 n * x 
U=]o 0 0 u 
0 0 0 0 

det U = 0 

FIGURA 1 


Formas escalonadas típicas de 
matrices cuadradas. 


TEOREMA 4 


3.2 Propiedades de los determinantes 171 


Suponga que una matriz cuadrada A se redujo a una forma escalonada U mediante rem- 
plazos de fila e intercambios de fila. (Esto siempre es posible. Véase el algoritmo de reduc- 
ción por filas en la sección 1.2). Si hay r intercambios, entonces el teorema 3 indica que: 


det A = (— 1) det U 


Como U está en forma escalonada, es triangular, y así det U es el producto de las entra- 
das diagonales u11,..., Unn. Si A es invertible, las entradas u;; son todas pivotes (porque A — 1, 
y las u¡¡ no se han escalado a 1). De otra forma, al menos u,,, es cero, y el producto u11 *** Unn 
es cero. Véase la figura 1. Por lo tanto, 


py: producto de 
detA = pivotes en U 


0 cuando A no es invertible 


cuando A es invertible a 


Es interesante hacer notar que aunque la forma escalonada U que se acaba de describir no 
es única (porque no está completamente reducida por filas), y los pivotes no son únicos, el 
producto de los pivotes es único, excepto por un posible signo menos. 

La fórmula (1) no solo da una interpretación concreta de det A, sino que también demues- 
tra el principal teorema de esta sección: 


Una matriz cuadrada A es invertible si y solo si det A 4 0. 


El teorema 4 agrega el enunciado “det A + 0” al teorema de la matriz invertible. Un útil 
corolario es que det A = O cuando las columnas de A son linealmente dependientes. Además, 
det A = O cuando las filas de A son linealmente dependientes. (Filas de A son columnas de 
A?, y columnas linealmente dependientes de A” hacen que A” sea singular. Cuando A” es sin- 
gular, también lo es A, de acuerdo con el teorema de la matriz invertible). En la práctica, la 
dependencia lineal es evidente cuando dos columnas o dos filas son iguales, o una columna 
o fila es cero. 


3 —1 2 -5 

EJEMPLO 3 Calcule det A, donde A = E A 
Tar a 

—5 —8 0 9 


SOLUCIÓN Sume la fila 1 multiplicada por 2 a la fila 3 para obtener 


Pep 25 
0 5 -3 —6 
det A = det 0 5 -3 6 =0 
—5 -8 0 9 
ya que la segunda y tercera filas de la segunda matriz son iguales. E 


NOTA NUMÉRICA 





1. La mayoría de los programas de cómputo que calculan det A para una matriz gene- 
ral A utilizan el método de la fórmula (1) anterior. 


2. Es posible demostrar que la evaluación de un determinante de n x n, utilizando 


operaciones de fila, requiere cerca de 2n?/3 operaciones aritméticas. Cualquier mi- 
crocomputadora moderna es capaz de calcular un determinante de 25 x 25 en una 
fracción de segundo, porque solo necesita realizar unas 10,000 operaciones. 
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TEOREMA 5 


Las computadoras también pueden manejar grandes matrices “dispersas”, con rutinas 
especiales que aprovechan la presencia de muchos ceros. Desde luego, las entradas cero tam- 
bién aceleran los cálculos a mano. Los cálculos en el siguiente ejemplo combinan el poder de 
las operaciones de fila con la estrategia de la sección 3.1, consistente en utilizar entradas nulas 
en los desarrollos por cofactores. 


0 1 2 —1 

EJEMPLO 4 Calcule det A, donde A = A 
ý 0 3 6 2 
ER, AD 


SOLUCIÓN Una buena forma de comenzar es utilizar como pivote el 2 en la columna 1, 
eliminando el —2 que está debajo de este. Después se utiliza un desarrollo por cofactores 
para reducir el tamaño del determinante, y luego otra operación de remplazo de fila. De esta 
forma, 


> a 1. 2-1 1 2-1 

det A = =-213 6 2|=—2|0 © 
E 0-3 1 0-3 1 
0 0-3 1 


Un intercambio de las filas 2 y 3 producirían un “determinante triangular”. Otro enfoque con- 
siste en efectuar un desarrollo en cofactores a lo largo de la primera columna: 


dd IN) E A = 0 (15) ==20 m 


Operaciones de columna 


Es posible realizar operaciones sobre las columnas de una matriz en forma análoga a las 
operaciones de fila que hemos estudiado. El siguiente teorema indica que las operaciones de 
columna y las operaciones de fila tienen los mismos efectos sobre los determinantes. 


Si A es una matriz de n x n, entonces det A7 = det A. 


DEMOSTRACIÓN El teorema es evidente para n = 1. Suponga que el teorema es verdadero 
para determinantes de k x k, y sean = k + 1. Entonces el cofactor de ay; en A es igual al co- 
factor de aj en A”, porque los cofactores implican determinantes de k x k. Así que el desarro- 
llo por cofactores de det A a lo largo de la primera fila es igual al desarrollo por cofactores de 
det A? a lo largo de la primera columna. Es decir, A y A” tienen determinantes iguales. Por lo 
tanto, el teorema es válido para n = 1, y la veracidad del teorema para un valor de n implica su 
veracidad para el siguiente valor de n. Por el principio de inducción, el teorema es verdadero 
para toda n = 1. E 


De acuerdo con el teorema 5, cada enunciado en el teorema 3 es válido cuando en todas 
partes la palabra fila se remplaza por columna. Para comprobar esta propiedad, basta aplicar 
a AT el teorema 3 original. Una operación de fila sobre A? significa una operación de columna 
sobre A. 

Las operaciones de columna son útiles tanto para fines teóricos como para realizar cálcu- 
los a mano. Sin embargo, para simplificar solo se efectuarán operaciones de fila en cálculos 
numéricos. 


Determinantes y productos matriciales 


La demostración del siguiente útil teorema se encuentra al final de la sección. Las aplicacio- 
nes se exponen en los ejercicios. 


TEOREMA 6 
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Propiedad multiplicativa 
Si A y B son matrices de n x n, entonces det AB = (det A)(det B). 


EJEMPLO 5 Compruebe el teorema 6 para A = E al y B = E al 


SOLUCIÓN 


D 
w 
II 
HA 
Gm 
N =e 
e] 
ra | 
— A 
NU 
bk 
II 


25 20 
14 13 


det AB = 25 - 13 — 20 - 14 = 325 — 280 = 45 
Como det A = 9 y det B = 5, 
(det A) (det B) = 9 - 5 = 45 = det AB B 
Advertencia: Un error común es pensar que el teorema 6 tiene un análogo para sumas de 


matrices. Sin embargo, en general, det(A + B) no es igual a det A + det B. 


Propiedad de linealidad de la función determinante 


Para una matriz A de n x n, podemos considerar a det A como una función de los n vectores 
columna en A. Se demostrará que si todas las columnas se mantienen fijas, excepto una, en- 
tonces det A es una función lineal de una variable (vectorial). 

Suponga que a la j-ésima columna de A se le permite variar, lo que se escribe como 


A= |a ei aj-1 xX aj+1 Sa a, | 


Defina una transformación T de R” a R mediante 


T(x) = det [| a; ... aj-1 X aj+1 ... a, ] 
Así, 
T(cx) = cT(x) para todos los escalares c, y todas las x en R”. (2) 
T(u + v) = T(u) + T(v) para toda u, v en R”. (3) 


La propiedad (2) es el teorema 3c) aplicado a las columnas de A. Una demostración de la 
propiedad (3) es consecuencia de un desarrollo por cofactores a lo largo de la ¡-ésima columna 
de det A. (Véase el ejercicio 43). Esta propiedad de (multi)linealidad del determinante tiene 
muchas consecuencias útiles que se estudian en cursos más avanzados. 


Demostraciones de los teoremas 3 y 6 


Es conveniente someter a prueba el teorema 3 cuando se enuncia en términos de las matrices 
elementales analizadas en la sección 2.2. Una matriz elemental E se denomina matriz de rem- 
plazo de fila si E se obtiene a partir de la identidad Z al sumar un múltiplo de una fila a otra; E 
es un intercambio si E se obtiene mediante el intercambio de dos filas de I; y E es una escala 
por r si E se obtiene al multiplicar una fila de / por un escalar r diferente de cero. Con esta 
terminología, el teorema 3 se puede reformular de la siguiente manera: 


174 CAPÍTULO 3 Determinantes 


Si A es una matriz de n x n y E es una matriz elemental de n x n, entonces 
det EA = (det E)(det A) 
donde 


1 siE es un remplazo de fila 
det E = 4—1 siE es un intercambio 


r siE es una escala por r 


DEMOSTRACIÓN DEL TEOREMA 3 La demostración es por inducción sobre el tamaño 
de A. El caso de una matriz de 2 x 2 se comprobó en los ejercicios 33 a 36 de la sección 3.1. 
Suponga que el teorema se ha comprobado para determinantes de matrices de k x k, con k = 2; 
sean = k + 1 y seaA den x n. La acción de E sobre A implica a dos filas o solamente a una. 
Así, se puede desarrollar det EA a lo largo de una fila que es inalterada por la acción de E, 
por ejemplo, la fila i. Sea A; (respectivamente, B;;) la matriz obtenida al eliminar la fila į y la 
columna ¡ de A (respectivamente, EA). Luego, las filas de B;; se obtienen de las filas de A; por 
el mismo tipo de operación elemental de fila que E efectúa sobre A. Como esas submatrices 
son únicamente de k x k, la suposición de inducción implica que 


det Bi = q : det Ay 


donde œ = 1, —1, o r, dependiendo de la naturaleza de E. El desarrollo por cofactores a lo 
largo de la fila i es 
det EA = aj (—1)*! det Bj, +--* + an (-1)*" det Bj, 
aai (—1)+! det Aj +-+ + dain (—1) t” det Ain 
= q - det A 


En particular, tomando A = [/,,, se observa que det E = 1, —1, o r, dependiendo de la natura- 
leza de E. Así, el teorema es válido para n = 2, y la veracidad del teorema para un valor de 
n implica su veracidad para el siguiente valor de n. Por el principio de inducción, el teorema 
debe ser válido para n = 2. El teorema es trivialmente verdadero para n = 1. E 


DEMOSTRACIÓN DEL TEOREMA 6 Si A noes invertible, entonces AB tampoco lo es, de 
acuerdo con el ejercicio 27 de la sección 2.3. En este caso, det AB = (det A)(det B), porque 
ambos lados valen cero, por el teorema 4. Si A es invertible, entonces A y la matriz identidad 
[,, son equivalentes por filas de acuerdo con el teorema de matriz invertible. Así, existen ma- 
trices elementales E;,..., Ey tales que 


A= EpEp-1*"* Ej - 1, = EpEp-1""* E] 


Por brevedad, escribimos IA en vez de det A. De esta forma, la repetida aplicación del teore- 
ma 3, como se acaba de reformular, muestra que 


|AB| = [Ep E1B| = |Ep||Ep-1 + E1B| Es 
= |E | E llB| =- = |Ep + Eill B| 
= |A||B] 


PROBLEMAS DE PRÁCTICA 


O 
2 nl 2 3 : 
1. Calcule 0.4 5 1% el menor número de pasos que sea posible. 


—3 10 -6 8 
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2. Utilice un determinante para decidir si v¡, v2, v3 son linealmente independientes, cuando 


5 —3 2 
vi = —7 Š V = 3 y V3 = —7 
9 =5 5 


3.2 EJERCICIOS 


En los ejercicios 1 a 4 cada ecuación ilustra una propiedad de los 
determinantes. Enuncie la propiedad. 


En los ejercicios del 15 al 20, calcule los determinantes, donde 














a b c 
0 5 -2 1 -3 6 di e E = 
1. |1 -3 6|=-[0 5 -2 g h i 
4 -1 8 4 -1 8 
a b c a b c 
2 —6 4 1 -3 2 15. | d e f 16. | 3d 3e 3f 
A A E ES E Sg 5h Si g h i 
1 6 3 1 6 3 
a b c g h i 
1 3 —4 1 3 —4 17. |g h i 18. |a b c 
3. |2 0 -—3|=/0 -6 5 d e f d e f 
a e 5 —4 7 
a b c 
L_ 2 3 1. 2. 3 19. |2d4d+a 2e4+b 2f+c 
4 0 5 -4=|0 5 -4 g h i 
3I T 4 0 1 —5 
a+d b+e c+f 
En los ejercicios 5 a 10 encuentre los determinantes por reducción de 20. d e f 
filas a una forma escalonada. g h i 
1 5 —6 1.5 —3 En los ejercicios 21 a 23, use determinantes para saber si la matriz 
5. |-1 —4 4 6 |3 -3 3 es invertible. 
-2 -7 9 2 13- -=7 2 3 0 s 0-1 
1 3 0 2 1 3 3 4 21. |1 3 4 22. |1 -3 -2 
E E: ro E-2= 1 2 1 0 5 3 
f 3. 5 2 1 f 2 5 4 -3 2 0 0 8 
1 -1 2 -3 a e 
23. 1 -7 -5 0 
de O e SO TO 
a 1.5 4 0 7 5 4 
‘j= 2 8 5 En los ejercicios 24 a 26, utilice determinantes para saber si el con- 
-l -2 3 junto de vectores es linealmente independiente. 
1 3 -1 0 -2 4 -7 -3 7 —8 7 
0 2 —4 -i -6 24. 6 |, 01, | -5 25. | —4 |, 5l, 0 
10. |-2 -6 2 3 9 -7 2 6 —6 7 =5 
E E oS 7 
3 AI I 3 2 | |-2 0 
ed aat ; ; 26 E 9 E 0 
En los ejercicios 11 a 14 calcule los determinantes combinando los |6 oP 3 |” 0 
métodos de reducción por filas y desarrollo por cofactores. 4 7 0 =3 


2. 5-3 -1 -1 2 3 0 

3 0 1 -3 3 4 3 0 

1. —6 0 —4 9 E 5 4 6 6 
4 10 -4 —1 4 2 4 3 

2.5 4l Egoe A 

4 7 6 2 1 3 r 0n=3 

13; 6 -2 —4 0 14: 2334-28 
6 7 7 0 3-4 0 4 


En los ejercicios 27 y 28, A y B son matrices de n x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 


27. a) Una operación de remplazo por filas no afecta al determi- 
nante de una matriz. 


b) El determinante de A es el producto de los pivotes en cual- 
quier forma escalonada U de A, multiplicada por (— 1)", don- 
de r es el número de intercambios de fila realizados durante 
la reducción por filas de A a U. 
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c) Si las columnas de A son linealmente dependientes, entonces 
det A = 0. 


d) det(A + B) = det A + det B. 
28. a) Si dos intercambios de fila se realizan en secuencia, enton- 40 
ces el nuevo determinante es igual al determinante original. 


b) El determinante de A es el producto de las entradas diagona- 
les en A. 


c) Si det A es cero, entonces dos filas o dos columnas son igua- 


les, o una fila o una columna es cero. 41. 


d) det AT = (—1)det A. 


1 0 1 
29. Calcule det B’, donde B = | 1 1 2 


2 1 42. 


30. Utilice el teorema 3 (pero no el teorema 4) para demostrar 
que si dos filas de una matriz cuadrada A son iguales, entonces 


det A = 0. Lo mismo es válido para dos columnas. ¿Por qué? 43. 


En los ejercicios 31 a 36, su explicación debe mencionar un teorema 
pertinente. 


31. Demuestre que si A es invertible, entonces det 47! = ——. 
det A 
32. Obtenga una fórmula para det(rA) cuando A es una matriz de 


nxn. 


33. Sean A y B matrices cuadradas. Demuestre que aun cuando 
AB y BA pueden no ser iguales, siempre es verdad que 


det AB = det BA. 44. 


34. Sean A y P matrices cuadradas, con P invertible. Demuestre que 
det(PAP7!) = det A. 


35. Sea U una matriz cuadrada tal que UTU = I. Demuestre que 
det U = 1. 


36. Suponga que A es una matriz cuadrada tal que det A4 = 0. 


Explique por qué A no puede ser invertible. 45. 


En los ejercicios 37 y 38, compruebe que det AB = (det A)(det B) 
para las matrices dadas. (No utilice el teorema 6). 


3 0 2 0 
37. a=|; TEL T 46. 


3 6 4 2 
alaia 3] 


39. Sean A y B matrices de 3 x 3, con det A = 4 y det B = —3. 
Con base en propiedades de determinantes (en el libro y en los 


ejercicios anteriores), calcule: 


a) det AB b) det5A c) detBT 
d) det A7! e) detA? 
. Sean A y B matrices de 4 x 4, con det A = —1 y det B = 2, 
Calcule: 
a) det AB b) det B’ c) det2A 
d) det ATA e) det B7!AB 


Compruebe que det A = det B + det C, donde 
_|a+e b+f _ļa b le f 
a=| c d kes e d 


1 0 a b 
Sean A = p i y B= p d | Demuestre que 


det(A + B) = det A + det B si y solo si a + d = 0. 
Compruebe que det A = det B + det C, donde 


411 ar ui + v1 
A= | aj an uz +v J, 
431 432 U3 + 03 
a1 412 ul a1 a12 vı 
B = | an an up, C=| aj an v 
431 432 u3 431 432 v3 


Sin embargo, observe, que A no es igual a B + C. 


La multiplicación por la derecha por una matriz elemental E 
afecta a las columnas de A en la misma forma que la multipli- 
cación por la izquierda afecta a las filas. Utilice los teoremas 
3 y 5, así como el evidente resultado de que E” es otra matriz 
elemental, para demostrar que 


det AE = (det E(det A) 


No utilice el teorema 6. 


[M] Calcule det A7A y det AA? para varias matrices de 4 x 5 
aleatorias y diversas matrices de 5 x 6, también aleatorias. ¿Qué 
puede decirse acerca de ATA y AAT cuando A tiene más colum- 
nas que filas? 


[M] Si det A es cercano a cero, ¿la matriz A es casi singular? 
Experimente con la matriz A de 4 x 4 casi singular del ejercicio 
9 de la sección 2.3. Calcule los determinantes de A, 10A y 0.14. 
Por otra parte, calcule los números de condición de esas ma- 
trices. Repita los cálculos cuando A es la matriz identidad de 
4 x 4. Analice sus resultados. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Realice remplazos de fila para crear ceros en la primera columna y así obtener una fila 


de ceros. 
1 —3 1 —2 
=5 -1 —2 
0 —4 5 1 
—3 10 —6 


Los 12] |i -3 1 -2 
0 18 210 ea 0 
Fat 5 PATOS 1 A 
0 1-3 2| jo 0 0-0 
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NE le Fila 1 sumad: 
2. det[v vz vi]=|-7 3 -—7|=|-2 0 -5 del 
9 5 5 9 =È 5 a la al 


la columna 2 


—2 —5 5 2 Cofactores de 


3. (35)+5- (—21)=0 


Según el teorema 4, la matriz [v1 v2 v3]no es invertible. Las columnas son linealmente 
dependientes, de acuerdo con el teorema de la matriz invertible. 


3.3 | REGLA DE CRAMER, VOLUMEN Y TRANSFORMACIONES LINEALES 


TEOREMA 7 


Esta sección aplica la teoría de las secciones anteriores para obtener importantes fórmulas 
teóricas y una interpretación geométrica del determinante. 


Regla de Cramer 


La regla de Cramer es necesaria en una variedad de cálculos teóricos. Por ejemplo, se puede 
utilizar para estudiar cómo resulta afectada la solución de Ax = b por cambios en las entradas 
de b. Sin embargo, la fórmula es ineficiente para cálculos a mano, excepto para matrices de 
2 x 2,0 quizá de 3 x 3. 

Para cualquier matriz A de n x n y cualquier b en [R”, sea A¡(b) la matriz obtenida a partir 
de A al remplazar la columna i por el vector b. 


Ab) = fai e b o a] 


col į 


Regla de Cramer 


Sea A una matriz invertible de n x n. Para cualquier b en R”, la única solución x de 
Ax = b tiene entradas dadas por 


det A; (b) 


eor a (1) 


Xi => 


DEMOSTRACIÓN Denote las columnas de A por aj,..., a, y las columnas de la matriz iden- 
tidad / de n x n por ej,..., €,. Si Ax = b, la definición de multiplicación matricial indica que 


A-1,(x)=A|e1 ess xX sa en | = [ Ae: EE AX atada Aen ] 
= |a e b AE an | = A; (b) 


Por la propiedad multiplicativa de determinantes, 
(det A)(det 7;(x)) = det A;(b) 


El segundo determinante a la izquierda es simplemente x;. (Realice un desarrollo por cofac- 
tores a lo largo de la i-ésima fila). Así, (det A) - x, = det A;(b). Esto demuestra (1), ya que d 
es invertible y det A + O. 


EJEMPLO 1 Use la regla de Cramer para resolver el sistema 
3x1 = 2X2 =6 
5x1 + 4x2 = 8 
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SOLUCIÓN Vea el sistema como Ax = b. Utilizando la notación ya presentada, 
372 6 —2 3 6 


Como det A = 2, el sistema tiene una solución única. Por la regla de Cramer, 


det A; (b 24+ 16 
_ detAı(b)  24+ =p 








“M= atA A 
det A>(b) 24+ 30 
A 07 
det A 2 E 


Aplicación a la ingeniería 


Un gran número de importantes problemas de ingeniería, particularmente en teoría del con- 
trol e ingeniería eléctrica, se pueden analizar con las transformadas de Laplace. Este enfoque 
convierte un adecuado sistema de ecuaciones diferenciales lineales a un sistema de ecua- 
ciones algebraicas lineales cuyos coeficientes implican un parámetro. El siguiente ejemplo 
ilustra el tipo de sistema algebraico que puede presentarse. 


EJEMPLO 2 Considere el siguiente sistema, en el cual s es un parámetro no especificado. 
Determine los valores de s para los cuales el sistema tiene una solución única, y utilice la regla 
de Cramer para describir la solución. 


3sxı — 2x2 = 4 


—6x1 + sx2= 1 


SOLUCIÓN Vea el sistema como Ax = b. De esta forma, 


en pa 0o-[% 7 


Puesto que 
det A = 33 — 12 = 3(s + 2)Xs — 2) 


el sistema tiene una solución única precisamente cuando s + +2. Para tal s, la solución es 
(x1, x2), donde 


_ detA¡(b) | 4s + 2 
~ detA  3(s+2)(s—2) 
det A2(b) 3s+24 s+8 





LEIA 3BD) (+D 


Una fórmula para A~! 


La regla de Cramer conduce fácilmente a una fórmula general para la inversa de una matriz A 
de n x n. La j-ésima columna de A~! es un vector x que satisface 


Ax = ej 


donde e; es la ¡-ésima columna de la matriz identidad, y la ¡-ésima entrada de x es la entrada 
(i, j) de A7?. De acuerdo con la regla de Cramer, 


E det A; (ej) 


trada (i, j) de A7!} = x; 
{entrada (i, j) de =x det 


2) 
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Recuerde que Aj; denota la submatriz de A formada al eliminar la fila ¿ y la columna i. Un 
desarrollo por cofactores a lo largo de la columna ¡ de A(e;) muestra que 


det A; (ey) a (=p det Ai => Ci (3) 


donde Cj; es un cofactor de A. De acuerdo con la expresión (2), la entrada (i, j) de A`! esel 
cofactor Cj; dividido entre det A. [Observe que los subíndices en C; son los inversos de (i, j )]. 
Por consiguiente, 


Ci Ca © Cnm 
Zo Ea” Ca s C i 
— detA : : ® 
Cin Con AS Can 


La matriz de cofactores en el miembro derecho de (4) se llama la adjunta de A, que se 
denota con adj A. (El término adjunta también tiene otro significado en libros avanzados de 
transformaciones lineales). El siguiente teorema reformula la expresión (4). 


TEOREMA 8 Una fórmula para la inversa 


Sea A una matriz invertible de n x n. Así, 


—1 SA . 
A EA adj A 
2 1 3 
EJEMPLO 3 Encuentre la inversa de la matriz A = | 1 —1 1 
1 4 —2 
SOLUCIÓN Los nueve cofactores son 
—1 1 1 1 1 —1 
1 3 2 3 2; 1 
Ca ==), 3 Ca=+| l=- Ca == i=- 
3 2 3 2 1 
Cu=+ 4 c=- 1 Ca =+] q > 


La matriz adjunta es la transpuesta de la matriz de cofactores. [Por ejemplo, C¡2 va a la po- 
sición (2, 1).] Así, 


-2 14 4 
adjA=| 3 -7 1 
5 A 3 


Se podría calcular det A directamente, pero el siguiente cálculo ofrece una comprobación de 
las operaciones anteriores y produce det A: 


-2 14 4]ļ]ð[2 ı 3 14 0 0 
(adiA)-A=| 3 -7 1ll1-1 1|=| O 14 oļ=m4 
Sn PD a 0 0 14 


Puesto que (adj A)A = 14/, el teorema 8 indica que det A = 14 y 
—2 14 4 -1/7 1 2/7 


Al==| 3 27 1|=|3/14 -1/2 1/14 E 
5 -7 -3 5/14 —1/2 -3/14 
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FIGURA 1 
Área = lad|. 


TEOREMA 9 


NOTA NUMÉRICA 




















El teorema 8 es útil principalmente para cálculos teóricos. La fórmula para A! permite 
deducir propiedades de la inversa sin calcularla en realidad. Excepto para casos espe- 
ciales, el algoritmo de la sección 2.2 ofrece una forma mucho mejor de calcular A7!, si 
la inversa es realmente necesaria. 

La regla de Cramer también es una herramienta teórica. Se puede emplear para 
estudiar qué tan sensible es la solución de Ax = b ante cambios en una entrada de b o 
de A (quizá debido al error experimental cuando se obtienen las entradas para b o A). 
Cuando A es una matriz de 3 x 3 con entradas complejas, entonces algunas veces la 
regla de Cramer se utiliza en cálculos a mano porque la reducción por filas de [A b] 
con aritmética compleja puede resultar confusa, y los determinantes son bastante fáci- 
les de calcular. Para grandes matrices de n x n (reales o complejas), la regla de Cramer 
es irremediablemente ineficiente. Para calcular solo un determinante se requiere tanto 
trabajo como resolver Ax = b por reducción de filas. 


Determinantes como área o volumen 


En la siguiente aplicación, se comprueba la interpretación geométrica de determinantes des- 
crita en la introducción de este capítulo. Aunque en el capítulo 6 se hará un análisis general de 
longitud y distancia en R”, aquí se supone que los conceptos euclidianos usuales de longitud, 
área y volumen ya se entienden para R? y R3. 


Si A es una matriz de 2 x 2, el área del paralelogramo definido por las columnas de A 
es det Al. Si A es una matriz de 3 x 3, el volumen del paralelepípedo definido por las 
columnas de A es ldet A|. 


DEMOSTRACIÓN Como es evidente, el teorema es cierto para cualquier matriz diagonal 


de 2 x 2: 
a 0 área del 
det = jad| = 
> | 0 d | | 144] ea 


Véase la figura 1. Será suficiente demostrar que cualquier matriz de 2 x 2, A = [a¡ ab], 
se puede transformar a una matriz diagonal de tal manera que no cambie el área del para- 
lelogramo asociado ni tampoco Idet Al. De la sección 3.2, se conoce que el valor absoluto 
del determinante es inalterado cuando dos columnas se intercambian, o un múltiplo de una 
columna se suma a otra. Es fácil ver que tales operaciones son suficientes para transformar 
a A en una matriz diagonal. Los intercambios de columnas no modifican el paralelogramo. 
Así, es suficiente probar la siguiente sencilla observación geométrica que se aplica a vectores 
en R? o R°: 





Sean a, y a, vectores diferentes de cero (no nulos). Luego, para cualquier escalar c, el 
área del paralelogramo definido por a, y a, es igual al área del paralelogramo determi- 
nado por a; y a, + caj. 


Para demostrar este enunciado, se supone que a, no es un múltiplo de a, ya que, de 
otra forma, los dos paralelogramos serían degenerados y tendrían área igual a cero. Si L 
es la recta que pasa por 0 y a,, entonces az + L es la recta que pasa por a, paralela a L, y 
a, + ca; está sobre esta recta. Véase la figura 2. Los puntos a, y a? + ca; tienen la misma 
distancia perpendicular a L. Por eso, los dos paralelogramos en la figura 2 tienen la misma 
área porque comparten la base de O a a¡. Esto completa la demostración para [R?, 





FIGURA 3 


Volumen = labcl. 
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a 
2 a,+L 


>> 


cas 


FIGURA 2 Dos paralelogramos de igual área. 


La demostración para R? es similar. Como es evidente, el teorema es cierto para una 
matriz diagonal de 3 x 3. Véase la figura 3. Y cualquier matriz A de 3 x 3 se puede trans- 
formar en una matriz diagonal utilizando operaciones de columna que no cambian a det Al. 
(Piense en efectuar operaciones de fila sobre A”). Así, es suficiente demostrar que esas ope- 
raciones no afectan el volumen del paralelepípedo definido por las columnas de A. 

La figura 4 muestra un paralelepípedo como una caja sombreada con dos lados incli- 
nados. Su volumen es el área de la base en el plano Gen (ay, az) multiplicada por la altura 
de a, sobre Gen (a;, az). Cualquier vector az + cay tiene la misma altura porque a, + ca; 
está en el plano a, + Gen (ay, az], el cual es paralelo a Gen (a, az). Así que el volumen 
del paralelepípedo queda inalterado cuando [a; «a» az] se cambia a [a; az+ca¡ a3]. 
Por consiguiente, una operación de remplazo de columna no afecta el volumen del parale- 
lepípedo. Como el intercambio de columnas no tiene efecto sobre el volumen, la demostra- 
ción se completa. E 






x 
a +ca 
24 caga 








0 aj 
FIGURA 4 Dos paralelepípedos de igual volumen. 


EJEMPLO 4 Calcule el área del paralelogramo definido por los puntos (—2, —2), (0, 3), 
(4, —1) y (6, 4). Véase la figura 5a). 


SOLUCIÓN Primero el paralelogramo se traslada de manera que un vértice esté en el ori- 
gen. Por ejemplo, reste el vértice (—2, —2) de cada uno de los cuatro vértices. El nuevo 
paralelogramo tiene la misma área, y sus vértices son (0, 0), (2, 5), (6, 1) y (8, 6). Véase la 
figura 5b). 











a) b) 


FIGURA 5 Trasladar un paralelogramo no cambia 
su área. 
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TEOREMA 10 


Este paralelogramo está definido por las columnas de 


Como [det A] = |-28 





, entonces el área del paralelogramo es 28. E 


Transformaciones lineales 


Los determinantes se pueden usar para describir una importante propiedad geométrica de 
transformaciones lineales en el plano y en R3. Si Tes una transformación lineal y S es un con- 
junto en el dominio de T, entonces T(S) denota el conjunto de imágenes de puntos en S. Nos 
interesa conocer cómo se compara el área (o volumen) de T(S) con el área (o volumen) del 
conjunto original S. Por conveniencia, cuando S es una región acotada por un paralelogramo, 
también nos referimos a $ como un paralelogramo. 


Sea T : R? > [R? una transformación lineal determinada por una matriz A de 2 x 2. Si S 
es un paralelogramo en R?, entonces 


{área de T(S)} = |det A| - {área de S} (5) 


Si T está determinada por una matriz A de 3 x 3, y si S es un paralelepípedo en R$, 
entonces 


[volumen de T(S)} = Idet Al - {volumen de S} (6) 


DEMOSTRACIÓN Considere el caso de 2 x 2, con A = [a a2]. Un paralelogramo en el 
origen en R? definido por los vectores b; y bz tiene la forma 


S = {sıbı + s2b92:0<s1<1,0<s2<1} 


La imagen de S bajo T consiste en puntos de la forma 


T(sıbı + s2b2) = sı T (bı) + s2T (b2) 
= sı Ábı + 5,4b> 


donde 0 =£ sı S 1, 0 S s2 S 1. De ello se sigue que T(S) es el paralelogramo determinado por 
las columnas de la matriz [Ab; Ab2]. Esta matriz se puede escribir como AB, donde B = [b; 
b2]. De acuerdo con el teorema 9 y el teorema del producto para determinantes, 
[área de T(S)) = |det AB| = |det A| - |det B| 

= |det A| - {área de S} (7) 
Un paralelogramo arbitrario tiene la forma p + S, donde p es un vector y S es un paralelogra- 
mo en el origen, como antes. Es fácil ver que T transforma a p + S en T(p) + T(S). (Véase el 
ejercicio 26). Puesto que la traslación no afecta el área de un conjunto, 

{área de T(p + S} = fárea de T(p) + T(S)} 

= {área de T(S)} Traslación 

= Idet A| - {área de S} Por la ecuación (7) 

3 Idet A| - {área de p + S$} Traslación 


Esto demuestra que (5) es válida para todos los paralelogramos en R?. Es análoga la demos- 
tración de (6) para el caso 3 x 3. E 
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Cuando se intenta generalizar el teorema 10 a una región en R? o R? que no está acotada 
por líneas rectas o planos, se debe enfrentar el problema de cómo definir y calcular su área 
o volumen. Este es un tema estudiado en cálculo, y solamente se indicará la idea básica para 
R?. Si R es una región plana que tiene área finita, entonces R se puede aproximar por una 
rejilla de pequeños cuadrados que están dentro de R. Haciendo los cuadrados suficientemente 
pequeños, el área de R se puede aproximar tanto como se quiera mediante la suma de las áreas 
de los pequeños cuadrados. Véase la figura 6. 






















































































































































































FIGURA 6 Aproximación de una región plana mediante la unión 
de cuadrados. La aproximación mejora conforme la rejilla 
se hace más fina. 


Si Tes una transformación lineal asociada con una matriz A de 2 x 2, entonces la imagen 
de la región plana R bajo T se aproxima mediante las imágenes de los pequeños cuadrados 
dentro de R. La demostración del teorema 10 señala que cada imagen es un paralelogramo 
cuya área es det A| por el área del cuadrado. Si R’ es la unión de los cuadrados dentro de 
R, entonces el área de T(R”) es Idet Al por el área de R’. Véase la figura 7. También, el área 
de T(R’) es cercana al área de T(R). Se puede dar un argumento que implique un proceso de 
cálculo de un límite, para justificar la siguiente generalización del teorema 10. 



























































































































































FIGURA 7 Aproximación de T(R) mediante la unión de paralelogramos. 


Las conclusiones del teorema 10 son válidas si S es una región en R? con área finita 
o una región en R? con volumen finito. 


EJEMPLO 5 Sean a y b números positivos. Encuentre el área de la región E acotada por 
la elipse cuya ecuación es 


2 2 
x x 

1 2 
Ad 
a? b2 
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u, SOLUCIÓN Se afirma que E es la imagen del disco unitario D bajo la transformación 
lineal T determinada por la matriz A = Eg , porque si u = A ,X= ai y 
5 O b u2 X2 
1 K x = Au, entonces 
X1 X2 
Uy = — Un = — 
T O aeng 
ya 
b De ello se sigue que u está en el disco unitario, con u? + u? < 1, si y solo si x está en E, con 
E (x1/a} + (12/bY < 1. Al generalizar el teorema 10, 
E y Xi 
{área de la elipse} = [área de T(D)) 
= |det A| - {área de D} 


= ab: (1)? = mab E 


PROBLEMA DE PRÁCTICA 


1 
Sea S el paralelogramo definido por los vectores bı = E y b2 H y sea 


A= | r a | Calcule el área de la imagen de S bajo el mapeo x > Ax. 


3.3 EJERCICIOS 


En los ejercicios 1 a 6, utilice la regla de Cramer para calcular las 3 0 0 1 2 4 
soluciones de los sistemas. 15. | —1 1 0 16. | 0 -3 1 
1. 5x1 +7x2 = 3 2. 4x1 + x=6 e 2 a Q 9 R 
2x1 +4x2=1 5x1 + 2x2 =7 17. Demuestre que si A es 2 x 2, entonces el teorema 8 da la misma 
fórmula para A”! que el teorema 4 de la sección 2.2. 
3. 3x1 => 2x2 = 37 4. —5X1 + 3x2 = 9 
sn o aS 18. Suponga que todas las entradas en A Jo enteros y det A =1. 
Explique por qué todas las entradas en A”? son enteros. 
en AO > A En los ejercicios 19 a 22, encuentre el área del paralelogramo cuyos 
3x1 + x=-=8 =x + 2x3; = 2 vértices se indican. 
X2 + 2x3 = —3 3x1 + x2 + 3x3 = —2 


19. (0,0), (5, 2), (6, 4), (11, 6) 


En los ejercicios 7 a 10, determine los valores del parámetro s 20. 0,0, (1, 3), 4, —5), 3, 2) 


para los cuales el sistema tiene una solución única, y describa la 


solución. 21. (-1,0), (0, 5), (1, —4), (2, 1) 
T. 6sxi + 4x2 = 5 8. 3sx1 — 5x2 = 3 22. (0, —2), (6, — 1), (—3, 1), (8, 2) 
IAE ARASA A A E 23. Encuentre el volumen del paralelepípedo con un vértice en el 
9. sxi — 25x2 = —1 10. 25 + x = 1 origen y vértices adyacentes en (1, 0, —2), (1, 2, 4) y (7, 1, 0). 
3x; + 6sx2 = 4 3sx1 +6sx, =2 24. Encuentre el volumen del paralelepípedo con un vértice en 
AN . À y el origen y vértices adyacentes en (1, 4, 0), (-2, —5, 2) y 
En los ejercicios 11 a 16, calcule la adjunta de la matriz dada, y uti- (1,2, —1) 
lice el teorema 8 para dar la inversa de la matriz. = i 
0 2 1 1 1 3 25. Utilice el concepto de volumen para explicar por qué el deter- 
11 3 0 0 12 2 2 1 minante de una matriz A de 3 x 3 es cero si y solo si A no es in- 
' 1 1 1 i 0.1.0 vertible. No recurra al teorema 4 de la sección 3.2. [Sugerencia: 
Piense en las columnas de A]. 
3 5 2. 009 26. Sean T : R” —> R” una transformación lineal, p un vector y S 
13. 7 l 14, E A i un conjunto en R”. Demuestre que la imagen de p + S bajo T 


es el conjunto trasladado T(p) + T(S) en R”. 


27. 


28. 


29. 


30. 


31. 
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Sea S el paralelogramo determinado por los vectores 32. Sea S el tetraedro en R? con vértices en los vectores 0, e1, e, y 


9) 5 E- “7 e3, y sea S' el tetraedro con vértices en los vectores 0, v1, V2 y V3. 
b; = | a y b = | J y sea Á = | | Calcule Véase la figura. 


3 2 


el área de la imagen de S bajo el mapeo x > Ax. 
a de 4 0 
Repita el ejercicio 27 con bı = ab b = 1 y 
7 -i2 
a ?] 


Encuentre una fórmula para el área del triángulo cuyos vértices 
son 0, vı, y v2 en RÊ. 





Sea R el triángulo con vértices en (x1, y1), (x2, y2) y 3, y3). 


a) Describa una transformación lineal que mapee a S sobre S”. 
Demuestre que 


b) Encuentre una fórmula para el volumen del tetraedro $” con- 


1 X1 yı ` 
[área del triángulo} = > det | x> ye siderando el hecho de que 

2 X3 y3 1 {volumen de $} = (1/3)fárea de la base) - (altura) 
[Sugerencia: Traslade R al origen restando uno de los vértices, 33. [M] Pruebe la fórmula del teorema 8 para la inversa con una 
y considere el ejercicio 29]. matriz aleatoria A de 4 x 4. Utilice un programa de matrices 


para calcular los cofactores de las submatrices 3 x 3, construya 


. R3 3 ión li : 
Sea T : R? — R’ la transformación lineal determinada por la la adjunta, y establezca que B = (adj A)/(det A). Luego, encuen- 


a 0 0 tre B — inv(A4), donde inv(A) es la inversa de A calculada por el 
matriz A=| 0 b 0 |, donde a, b y c son números po- programa de matrices. Utilice aritmética de punto flotante con 
0 0 c el número máximo posible de lugares decimales. Informe sus 

resultados. 


sitivos. Sea S la bola unitaria, cuya superficie frontera tiene 


la ecuación x? + x? + x? = 1. 34. [M] Pruebe la regla de Cramer con una matriz A de 4 x 4 y un 
vector aleatorio b, 4 x 1. Calcule cada entrada en la solución 


4): Demuestre qüe:-THS) está acotada: porel elipsoidescon-lá de Ax = b, y compare esas entradas con las correspondientes en 


2 2 2 


sua ón ol de Na. dl Pa L A7'b. Escriba el comando (u oprima las teclas) para su progra- 
aa b œ ma de matrices que emplea la regla de Cramer para producir la 

b) Con base en el hecho de que el volumen de la bola unitaria segunda entrada de x. 
es 41/3, obtenga el volumen de la región acotada por el elip- 35. [M] Si su versión de MATLAB tiene el comando flops, úse- 


soide en el inciso a). lo para contar el número de operaciones de punto flotante para 


calcular A7! considerando una matriz aleatoria de 30 X 30. 
Compare este número con el número de flops necesarios para 
construir (adj A)/(det A). 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


1 5 
de y d 


de la imagen de S bajo el mapeo x > Ax es 


El área de S es = 14, y det A = 2. De acuerdo con el teorema 10, el área 








[det A| - (área de $] = 2 - 14 = 28 


CAPÍTULO 3 EJERCICIOS COMPLEMENTARIOS 


1. 


Marque cada enunciado como verdadero o falso. Justifique sus d) Si A y B son matrices de n x n, con det A = 2 y det B = 3, 
respuestas. Suponga que todas las matrices son cuadradas. entonces det(A + B) = 5. 
a) Si A es una matriz de 2 x 2 con determinante cero, entonces e) Si A es den x n con det A = 2, entonces det A? = 6. 

una columna de A es un múltiplo de la otra. f) Si B se obtiene al intercambiar dos filas de A, entonces 
b) Si dos filas de una matriz A de 3 x 3 son iguales, entonces det B = det A. 

det A = 0. 


g) Si B se obtiene multiplicando la fila 3 de A por 5, entonces 
c) Si A es una matriz de 3 x 3, entonces det 5A = 5 det A. det B = 5 - det A. 
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h) Si B se forma sumando a una fila de A una combinación 
lineal de las otras filas, entonces det B = det A. 


i) det AT = —det A. 
j) det (—A) = -det A. 
k) det (ATA) = 0. 


D Cualquier sistema de n ecuaciones lineales en n variables se 
puede resolver con la regla de Cramer. 


m) Si u y v están en R? y det [u v] = 10, entonces el área del 
triángulo en el plano con vértices en 0, u y v es 10. 


n) Si A? = 0, entonces det A = 0. 
0) Si A es invertible, entonces det A7! = det A. 


p) Si A es invertible, entonces (det AMdet 47!) = 1. 


En los ejercicios 2 a 4, utilice operaciones de fila para demostrar que 
todos los determinantes son cero. 


12 13 14 1 a b+c 

15 16 17 3. |1 b a+c 

18 19 20 1 c a+b 
a b c 

a+x b+x c+x 

a+y b+y c+y 


En los ejercicios 5 y 6, calcule los determinantes. 


AVA oD 
oo0oo=»- 
OUO VY 
Ny OU o o 
oooNwowo 





OoonoR* 
0 00H 00 
00000 
O Ww oo o œ 
OooXxnou 


Demuestre que la ecuación de la recta en R? que pasa por los 
puntos distintos (x1, y1) y (x2, y2) se puede escribir como 


1 x y 
det | 1 X1 y |=0 
1 X2 Ya 


Encuentre una ecuación de determinantes de 3 x 3, similar a la 
del ejercicio 7, que describa la ecuación de la recta con pendien- 


te m y que pasa por (x1, y1). 


Los ejercicios 9 y 10 se relacionan con los determinantes de las si- 
guientes matrices de Vandermonde. 


V() = 
X2 X3 


Boi. go i 


N 
xo ox 
wue Nu =w 
Dins 


X3 X3 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


Utilice operaciones de fila para demostrar que 

det T = (b — aX(c — aX(c — b) 

Sea f(t) = det V, con x1, x2, x3 todos distintos. Explique por 
qué f(t) es un polinomio cúbico, demuestre que el coeficiente 


de 13 es diferente de cero, y encuentre tres puntos sobre la grá- 
fica de f. 


Calcule el área del paralelogramo definido por los puntos (1, 4), 
(1, 5), (3, 9) y (5, 8). ¿Cómo comprobar que el cuadrilátero 
determinado por estos puntos es realmente un paralelogramo? 


Con base en el concepto de área de un paralelogramo, escriba un 
enunciado sobre una matriz A de 2 x 2, que sea válido si y solo 
si A es invertible. 


Demuestre que si A es invertible, entonces adj A es invertible, y 


1 
dj A)! = — 
(adj4) det A 


[Sugerencia: Dadas las matrices B y C, ¿con qué cálculo(s) se 
demostraría que C es la inversa de B?]. 


Sean A, B, C, D e I matrices de n x n. Utilice la definición o 
las propiedades de un determinante para justificar las siguientes 
fórmulas. El inciso c) es útil en aplicaciones de valores propios 
(capítulo 5). 


A 0 I 0 
a) der[ y | oe b) der e p |= 4D 


c) ael ó p] = (det A)(det D) = de >] 


Sean A, B, C y D matrices de n x n con A invertible. 


a) Encuentre las matrices X y Y para producir el bloque de fac- 
torización LU 


A Boa E OJJA B 
C D| |X I 0 Y 
y entonces demuestre que 


A B| i 
JF z] = (det A) - det(D — CA" B) 


b) Demuestre que si AC = CA, entonces 


a| é 5 = det(AD — CB) 


Sea J la matriz de n x n con solo números 1, y considere 
A = (a — b)I + bJ; es decir, 


a b b œ b 
b a b > b 

a-b b a œ b 

al 


Confirme que det A = (a — b)""*[a + (n — 1)b] como sigue: 


b b b 
a) Reste la fila 2 de la fila 1, la fila 3 de la fila 2, y así sucesiva- 


mente, y explique por qué esto no cambia el determinante de 
la matriz. 


17. 


18. 


b) Con la matriz resultante del inciso a), sume la columna 1 a la 
columna 2, después sume esta nueva columna 2 a la columna 
3, y así sucesivamente, y explique por qué esto no cambia el 
determinante. 


c) Encuentre el determinante de la matriz resultante en b). 


Sea A la matriz original del ejercicio 16, y sean 


a—b b b ... b 
0 a b b 
B 0 b a b 
| 0 b b . d 
b b b b 
b a b b 
C= b b a iil 
b b b ... ol 


Observe que A, B y C son muy semejantes excepto que la prime- 
ra columna de A es igual a la suma de las primeras columnas de 
B y C. Una propiedad de linealidad de la función determinante, 
analizada en la sección 3.2, dice que det A = det B + det C. Uti- 
lice este hecho para probar la fórmula del ejercicio 16 mediante 
inducción sobre el tamaño de la matriz A. 


[M] Aplique el resultado del ejercicio 16 para encontrar los de- 
terminantes de las siguientes matrices, y confirme sus respues- 
tas utilizando un programa de matrices. 


8 
3 
3 


É 


00 00 00 w 
00 00 Ww o 
oo Ww 00 00 
Ww 00 00 00 
UY UY UU 00 U 
UY UY 00 UY Uy 
UY 00 UY UU Uy 
00 UY Uy UY Uy 


19. 


20. 
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[M] Utilice un programa de matrices para calcular los determi- 
nantes de las siguientes matrices. 


1 1 1 1 
l l l Fo 2 2 2 
E- 2- 2 
I 2 3 112 3 3 
1 2 3 4 


Ra 
NNNN= 
GU UY Un 
E SI SN 
QN =h 0 NN 


Utilice los resultados para hacer una conjetura sobre el de- 
terminante de la matriz que se presenta a continuación, y confir- 
me la conjetura utilizando operaciones de fila para evaluar ese 
determinante. 


1 1 1 ... 1 
1 2.2 e 2 
1 2x. 3 ... 3 | 


E 


[M] Aplique el método del ejercicio 19 para hacer una conjetura 
sobre el determinante de 


1 1 1 ... 1 
1 3 23 ... 3 
1 3.06: +--. 6 


eN 


Justifique su conjetura. [Sugerencia: Considere el ejercicio 14c) 
y el resultado del ejercicio 19]. 


1 3 6 
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Espacios vectoriales 


EJEMPLO INTRODUCTORIO 


Vuelo espacial y sistemas 
de control 


Con sus 12 pisos de altura y un peso de 75 toneladas, el 
Columbia se elevó majestuosamente de la plataforma de 
lanzamiento en una fresca mañana de Domingo de Ramos 
en abril de 1981. Producto de 10 años de una intensa labor 
de investigación y desarrollo, el primer transbordador 
espacial de Estados Unidos fue un triunfo de diseño de la 
ingeniería de sistemas de control, en el que participaron 
varias ramas de la ingeniería: aeronáutica, química, 
eléctrica, hidráulica y mecánica. 


Los sistemas de control de la nave espacial son abso- 
lutamente esenciales para el vuelo. Como el transbordador 
tiene un fuselaje inestable, requiere de una monitorización 
computarizada constante durante el vuelo atmosférico. 

El sistema de control de vuelo envía una secuencia de 
comandos a las superficies de control aerodinámico y 
a 44 pequeños impulsores de propulsión a chorro. 

En la figura 1 se muestra un típico sistema de circuito 








cerrado de retroalimentación que controla el cabeceo del 
transbordador durante el vuelo. (El cabeceo es el ángulo 

de elevación del cono de proa). Los símbolos de unión (8) 
indican dónde se añaden las señales de varios sensores a 

las señales de la computadora que fluyen a través de la parte 
superior de la figura. 


Matemáticamente, las señales de entrada y salida a un 
sistema de ingeniería son funciones. En las aplicaciones, es 
importante que estas funciones se puedan sumar, como se 
muestra en la figura 1, y multiplicarse por escalares. Estas 
dos operaciones con las funciones tienen propiedades alge- 
braicas que son completamente análogas a las operaciones 
de suma de vectores en R” y a la multiplicación de un vec- 
tor por un escalar, como se verá en las secciones 4.1 y 4.8. 
Por esta razón, el conjunto de todas las entradas posibles 
(funciones) se denomina espacio vectorial. Los fundamentos 
matemáticos para la ingeniería de sistemas se basan en espacios 












































Tasa del Aceleración 
cabeceo del cabeceo 
ordenado ordenado a 
Dinámica del 
A i Controlador transbordador 
+ 
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rror en la 
E la del aceleración Acelerómeiro 
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FIGURA 1 Sistema de control del cabeceo para el transbordador espacial. (Fuente: Adaptado de Space Shuttle 
GN&C Operations Manual, Rockwell International, © 1988). 
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vectoriales de funciones, y en este capítulo 4 se amplía la Más adelante, veremos cómo surgen otros espacios vectoriales 
teoría de los vectores en R” para incluir dichas funciones. en ingeniería, física y estadística. 





Las “semillas” matemáticas sembradas en los capítulos 1 y 2 germinan y comienzan a florecer 
en este capítulo. La belleza y el poder del álgebra lineal se apreciarán más claramente cuando 
el lector considere a R” solo como uno de tantos espacios vectoriales que surgen de forma 
natural en problemas aplicados. En realidad, el estudio de espacios vectoriales no es muy 
diferente del propio estudio de R”, porque usted podrá utilizar su experiencia geométrica con 
R? y R3 para visualizar muchos conceptos generales. 

Comenzando con las definiciones básicas en la sección 4.1, el marco teórico de los espa- 
cios vectoriales se desarrolla gradualmente a lo largo del capítulo. Uno de los objetivos de las 
secciones 4.3 a 4.5 es demostrar cuán estrechamente se parecen otros espacios vectoriales a 
RR”. En la sección 4.6 se estudiará el rango, uno de los temas más importantes de este capítulo, 
utilizando la terminología de espacio vectorial para vincular datos importantes de las matrices 
rectangulares. En la sección 4.8 se aplica la teoría del capítulo a las señales discretas y ecua- 
ciones en diferencias utilizadas en los sistemas de control digital, como en el transbordador 
espacial. Las cadenas de Markov, en la sección 4.9, representan un cambio de ritmo respecto 
de las secciones más teóricas del capítulo y dan buenos ejemplos para los conceptos que se 
introducirán en el capítulo 5. 


4.1 | ESPACIOS Y SUBESPACIOS VECTORIALES 


DEFINICIÓN 


Gran parte de la teoría en los capítulos 1 y 2 se basa en ciertas propiedades algebraicas senci- 
llas y evidentes de [R”, que se listan en la sección 1.3. De hecho, muchos otros sistemas ma- 
temáticos tienen las mismas propiedades. Las propiedades específicas de interés se incluyen 
en la siguiente definición. 


Un espacio vectorial es un conjunto no vacío V de objetos, llamados vectores, en el 
que están definidas dos operaciones, llamadas suma y multiplicación por escalares 
(números reales), sujetas a los 10 axiomas (o reglas) que se listan a continuación.' 
Los axiomas deben ser válidos para todos los vectores u, v, w en V, y para todos los 
escalares c y d. 

1. La suma de u y v, denotada con u + y, está en V. 

2u+tv=v+u. 

3. (u + v) + w=u+ (v + w). 

4. Hay un vector cero (0) en V tal que u + 0 = u. 

5. Para cada u en V, existe un vector —u en V tal que u + (—u) = 0. 

6. El múltiplo escalar de u por c, que se denota con cu, está en V. 

7. c(u + v) = cu + cv. 

8. (c + d)u = cu + du. 

9. c(du) = (cd )u. 
10. lu = u. 


Técnicamente, V es un espacio vectorial real. Toda la teoría en este capítulo también es válida para un espacio 
vectorial complejo en el que los escalares son números complejos. Trataremos brevemente este asunto en el capí- 
tulo 5. Hasta entonces, se supone que todos los escalares son reales. 


FIGURA 1 


3v 
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Utilizando tan solo estos axiomas, es posible demostrar que el vector cero en el axioma 4 
es único, y el vector —u, llamado el negativo de u, en el axioma 5 es único para toda u en V. 
Véase los ejercicios 25 y 26. Demostraciones de los hechos que se presentan a continuación 
se describen en los ejercicios: 


Para cada u en V y escalar c, 


0u =0 a) 
c0=0 2) 
—u = (—1)u (3) 


EJEMPLO 1 Los espacios [R”, donde n = 1, son los ejemplos principales de espacios 
vectoriales. La intuición geométrica desarrollada para R? le ayudará a entender y visualizar 
muchos conceptos en todo el capítulo. E 


EJEMPLO 2 Sea Vel conjunto de todas las flechas (segmentos de recta dirigidos) en el 
espacio tridimensional; se considera que dos flechas son iguales si tienen la misma longitud y 
la punta en la misma dirección. Defina la suma por la regla del paralelogramo (de la sección 
1.3), y para cada v en V, defina cv como la flecha cuya longitud es lcl por la longitud de v, 
apuntando en la misma dirección que v si c = 0 y, en caso contrario, apuntando en la direc- 
ción opuesta. (Véase la figura 1). Demuestre que V es un espacio vectorial. Este espacio es un 
modelo común de los problemas físicos de varias fuerzas. 


SOLUCIÓN La definición de V es geométrica, utilizando los conceptos de longitud y direc- 
ción. Ningún sistema de coordenadas xyz está implicado. Una flecha de longitud cero es un 
punto único y representa el vector cero. El negativo de v es (— 1)v. Por lo tanto, los axiomas 
1, 4, 5, 6 y 10 son evidentes. El resto se comprobará con geometría. Por ejemplo, véase las 





figuras 2 y 3. E 
v+u 
WwW 
V u 
u 
u+v 
FIGURA 2 u+v=v+u. FIGURA 3 (u + v) + w=u + (v + w). 


EJEMPLO 3 Sea $ el espacio de todas las secuencias doblemente infinitas de números 
(que generalmente se anotan en una fila más que en una columna): 


DJ = (.., Y-2 Y-1> Yo» Y1) Y2» ++>) 


Si {zx} es otro elemento de S, entonces la suma {y} + {zg} es la sucesión {yg + zg} for- 
mada por la suma de los términos correspondientes de (yz) y [zx). El múltiplo escalar c[ yz) 
es la sucesión {cyz}. Los axiomas de espacio vectorial se comprueban en la misma forma 
que para R”. 

Los elementos de S surgen en ingeniería, por ejemplo, cuando una señal se mide (o se 
muestrea) en tiempos discretos. Una señal puede ser eléctrica, mecánica, óptica, etcétera. 
Los sistemas de control principal del transbordador espacial, que se mencionaron en la in- 
troducción del capítulo, usan señales discretas (o digitales). Por conveniencia, llamaremos 
a S el espacio de señales (discretas de tiempo). Una señal se puede visualizar con una gráfica 
como la que se ilustra en la figura 4. E 
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f+8 


FIGURA 5 
La suma de dos vectores 
(funciones). 


En Un 1i 
os 0 AL 


FIGURA 4 Una señal discreta de tiempo. 


EJEMPLO 4 Para n = 0, el conjunto [P,, de polinomios de grado n o menor consiste en 
todos los polinomios de la forma 


p(t) = ao + ait + azt? + -++ + ant” (4) 


donde los coeficientes ag,..., a, y la variable £ son números reales. El grado de p es la ma- 
yor potencia de £ en (4) cuyo coeficiente no es cero. Si p(£) = ay F O, el grado de p es cero. 
Si todos los coeficientes son iguales a cero, p se llama el polinomio cero. El polinomio cero 
está incluido en [P,,, a pesar de que su grado, por razones técnicas, no esté definido. 

Si p está dada por la ecuación (4) y si q(1) = bo + bjt + -** + b,£", entonces la suma 
p + q se define mediante 


P+D = p) +q) 
= (ao + bo) + (a; + bi) +. + (an + b )t” 


El múltiplo escalar cp es el polinomio definido por 
(cp)(t) = cp(t) = cao + (cai)t +--+ (can)t” 


Estas definiciones satisfacen los axiomas 1 y 6, ya que p + q y cp son polinomios de 
grado igual o menor que n. Los axiomas 2, 3, y 7 a 10 son consecuencias de las propie- 
dades de los números reales. Evidentemente, el polinomio cero actúa como vector cero en 
el axioma 4. Por último, (—1)p actúa como el negativo de p, por lo que el axioma 5 está sa- 
tisfecho. Así, [P,, es un espacio vectorial. 

Se utilizan espacios vectoriales P, para varias n, por ejemplo, en el análisis de tendencia 
estadística de datos, que se analiza en la sección 6.8. E 


EJEMPLO 5 Sea V el conjunto de todas las funciones de valores reales definidas en un 
conjunto D. (Por lo general, D es el conjunto de números reales o algún intervalo en la recta 
real). Las funciones se suman en la forma habitual: f + g es la función cuyo valor en ż en el 
dominio D es f(t) + g(t). Asimismo, para un escalar c y una f en V, el múltiplo escalar cf es 
la función cuyo valor en t es cf(t). Por ejemplo, si D = R, f(A = 1 + sen 2t£, y g) = 2 + .5t, 
entonces 















































€+g=3 + sen2t+.5t y RQA) =4+t 











Dos funciones en V son iguales si y solo si sus valores son iguales para toda t en D. 
Por lo tanto, el vector cero en V es la función igual a cero, f(t) = O para toda t, y el negativo 
de f es (— 1)f. Como es evidente, los axiomas 1 y 6 son ciertos, y los otros axiomas se dedu- 
cen de las propiedades de los números reales, por lo que V es un espacio vectorial. E 





Es importante pensar en cada función en el espacio vectorial V del ejemplo 5 como un 
objeto único, un solo “punto” o un vector en el espacio vectorial. La suma de dos vectores 
f y g (funciones en V, o elementos de cualquier espacio vectorial) se puede visualizar como 
en la figura 5, ya que esto le ayudará a aplicar a un espacio vectorial general la intuición 
geométrica que ha desarrollado al trabajar con el espacio vectorial R”. Consulte la Guía de 
estudio como ayuda conforme aprenda a adoptar este punto de vista más general. 


DEFINICIÓN 


V 


FIGURA 6 
Un subespacio de V. 


FIGURA 7 
El plano xıx2 como un subespacio 
de R?. 
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Subespacios 


En muchos problemas, un espacio vectorial se compone de un subconjunto adecuado de vec- 
tores de un espacio vectorial más grande. En este caso, solo se deben comprobar tres de los 10 
axiomas de espacio vectorial, y el resto se satisfacen de manera automática. 


Un subespacio de un espacio vectorial V es un subconjunto H de V que tiene tres pro- 
piedades: 


a) El vector cero de V está en H.? 


b) H es cerrado bajo la suma de vectores. Es decir, por cada u y v en H, la suma u + v 
está en H. 


c) H es cerrado bajo la multiplicación por escalares. Es decir, para cada u en H y cada 
escalar c, el vector cu está en H. 


Las propiedades a), b) y c) garantizan que un subespacio H de V sea en sí mismo un espa- 
cio vectorial bajo las operaciones de espacio vectorial ya definidas en V. Para comprobar esto, 
observe que las propiedades a), b) y c) corresponden a los axiomas 1, 4 y 6. Los axiomas 2, 
3 y 7a 10 son automáticamente verdaderos en A, ya que se aplican a todos los elementos de 
V, incluidos los de H. El axioma 5 también es verdadero en H, ya que si u está en H, entonces 
(— Du está en H de acuerdo con la propiedad c), y sabemos a partir de la ecuación (3) de la 
página 191 que (—1)u es el vector —u en el axioma 5. 

Así, cada subespacio es un espacio vectorial. Por el contrario, todo espacio vectorial es un 
subespacio (de sí mismo y, posiblemente, de otros espacios más grandes). El término subespa- 
cio se utiliza cuando al menos dos espacios vectoriales están en mente, con uno dentro del otro, 
y la frase subespacio de V identifica a V como el espacio más grande. (Véase la figura 6). 


EJEMPLO 6 El conjunto que consta solo del vector cero en un espacio vectorial V es un 
subespacio de V, llamado subespacio cero, y se representa como {0}. E 


EJEMPLO 7 Sea [P el conjunto de todos los polinomios con coeficientes reales, con ope- 
raciones en P definidas como en las funciones. De esta forma, P es un subespacio del espacio 
de todas las funciones de valores reales definidas en R. Además, para cada n = 0, P, es un 
subespacio de P, ya que P, es un subconjunto de P que contiene el polinomio cero; la suma 
de dos polinomios en [P,, también está en [P,,, y un múltiplo escalar de un polinomio en P, 
también está en P,,. E 


EJEMPLO 8 El espacio vectorial R? no es un subespacio de R? porque R? ni siquiera es 
un subconjunto de R*. (Todos los vectores en R* tienen tres entradas, mientras que los vecto- 
res de R? tienen solo dos). El conjunto 


H = t |: sy tson reales 


es un subconjunto de R? que se “ve” y “actúa” como R?, aunque lógicamente es distinto de 
R?. Véase la figura 7. Demuestre que H es un subespacio de R?. 


SOLUCIÓN El vector cero está en H, y H es cerrado bajo la suma de vectores y la multi- 
plicación escalar debido a que estas operaciones sobre los vectores de A siempre producen 
vectores cuyas terceras entradas son iguales a cero (y, por lo tanto, pertenecen a H). Por con- 
siguiente, H es un subespacio de R°. E 


2 Algunos libros remplazan la propiedad a) en esta definición por el supuesto de que H no es vacío. Así, a) se puede 
deducir a partir de c) y el hecho de que Ou = 0. Pero la mejor manera de someter a prueba un subespacio es bus- 
car primero al vector cero. Si 0 está en H, entonces se deben revisar las propiedades b) y c). Si 0 no está en H, en- 
tonces H no puede ser un subespacio y no se necesita comprobar las otras propiedades. 
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FIGURA 8 
Una recta que no es un espacio 
vectorial. 


Q 


Xx 


FIGURA 9 
Un ejemplo de un subespacio. 


TEOREMA 1 


EJEMPLO 9 Un plano en R? que no pasa por el origen no es un subespacio de [R3, por- 
que el plano no contiene el vector cero de R?. Del mismo modo, una recta en R? que no 
pasa por el origen, como en la figura 8, no es un subespacio de R?. E 


Un subespacio generado por un conjunto 


El siguiente ejemplo ilustra una de las formas más comunes de describir un subespacio. Como 
en el capítulo 1, el término combinación lineal se refiere a cualquier suma de los múlti- 
plos escalares de vectores, y Gen {v1,..., Vp} denota el conjunto de todos los vectores que 
se pueden escribir como combinaciones lineales de v1,..., Vp. 


EJEMPLO 10 Dados v, y va en un espacio vectorial V, sea H = Gen {v1, v2}. Demuestre 
que H es un subespacio de V. 


SOLUCIÓN El vector cero está en H, ya que 0 = 0v; + 0v2. Para demostrar que H es cerrado 
bajo la suma de vectores, tome dos vectores arbitrarios en H, por ejemplo, 


U=SIVI+S2V2 Y W=lÍ1V1 + lv 


Por los axiomas 2, 3 y 8 para el espacio vectorial V, 


u +W = (S1V1 + 82V2) + (41 V] + £2v2) 
= (s1 + £1)v1 + (52 + £2) va 


Así que u + w está en H. Además, si c es un escalar cualquiera, entonces por los axiomas 
7y9, 


cu = c(sivi + S2V2) = (0s1)v1 + (cs2)v2 


lo que demuestra que cu está en H, y H es cerrado bajo la multiplicación por escalares. 
Por lo tanto, A es un subespacio de V. E 


En la sección 4.5, veremos que todo subespacio de R? distinto de cero, que no sea 
R? mismo, es Gen [v1, V2} para algunos vı y v2 linealmente independientes o Gen {v} para 
v % 0. En el primer caso, el subespacio es un plano que pasa por el origen; en el segundo 
caso, se trata de una recta que pasa por el origen. (Véase la figura 9). Es útil tener en mente 
estas imágenes geométricas, incluso para un espacio vectorial abstracto. 

El argumento en el ejemplo 10 se puede generalizar fácilmente para comprobar el si- 
guiente teorema. 


Si v1,..., Vp están en un espacio vectorial V, entonces Gen (v;,..., v») es un subes- 
pacio de V. 
Se llama Gen (vi,..., Y») al subespacio generado por (v;,..., Vp). Dado un subes- 
pacio H de V, un conjunto generador para H es un conjunto (v;,..., v») en H tal que 


H = Gen {v1,..., Vp}- 
El siguiente ejemplo muestra cómo utilizar el teorema 1. 


EJEMPLO 11 Sea H el conjunto de todos los vectores de la forma (a — 3b, b — a, 
a, b), donde a y b son escalares arbitrarios. Es decir, sea H = {(a — 3b, b — a, a, b): a y b 
en R}. Demuestre que H es un subespacio de R4. 


4.1 Espacios y subespacios vectoriales 195 


SOLUCIÓN Represente los vectores en HA como vectores columna. Así, un vector arbitrario 
en H tiene la forma 


a — 3b 1 —3 
b=a —1 1 
i =a| į} +b 0 
b 0 1 

t 1 

vi va 


Este cálculo muestra que H = Gen {v;, V2}, donde vı y v2 son los vectores indicados anterior- 
mente. Por lo tanto, H es un subespacio de R4 de acuerdo con el teorema 1. A 


El ejemplo 11 muestra una técnica útil para expresar un subespacio H como el conjunto 
de combinaciones lineales de una pequeña colección de vectores. Si H = Gen {v1,..., Vp}, po- 
demos pensar en los vectores V1,..., Vp del conjunto generador como “asas” que nos permiten 
sujetar el subespacio H. Cálculos con un número infinito de vectores en H con frecuencia se 
reducen a operaciones con un número finito de vectores en el conjunto generador. 


EJEMPLO 12 Determine qué valor(es) de h hará(n) que y sea un subespacio de R? 
generado por V1, V2, V3, Sİ 


1 5 -3 —4 
v=]|-1], v=|-4]|, v= 1j y y= 3 
-2 -7 0 h 


SOLUCIÓN Esta pregunta es el problema de práctica 2 en la sección 1.3, que aquí se mo- 
dificó utilizando el término subespacio en vez de Gen {v1, V2, V3}. La solución obtenida ahí 
muestra que y está en Gen {Vv1, V2, V3} si y solo si A = 5. Vale la pena revisar esta solución 
ahora, junto con los ejercicios 11 a 16 y 19 a 21 de la sección 1.3. B 


Aunque muchos espacios vectoriales en este capítulo son subespacios de R”, es importan- 
te considerar que la teoría abstracta se aplica a otros espacios vectoriales. Espacios vectoriales 
de funciones surgen en muchas aplicaciones, y más adelante se tratarán con más detalle. 


PROBLEMAS DE PRÁCTICA 


1. Demuestre que el conjunto H de todos los puntos en R? de la forma (3s, 2 + 5s) no es un 
espacio vectorial, al mostrar que no es cerrado bajo la multiplicación escalar. (Encuentre 
un vector específico u en H y un escalar c tal que cu no está en H). 


2. Sea W = Gen (vj,..., Vp), donde v;,..., V, Se encuentran en un espacio vectorial V. 
Demuestre que vz está en W para 1 <= k <= p. [Sugerencia: Escriba primero una ecuación 
que demuestre que v; está en W. Después, ajuste su notación para el caso general]. 


4.1 EJERCICIOS 


1. 


Sea V el primer cuadrante en el plano xy; es decir, sea 2. Sea W la unión del primer y tercer cuadrantes en el plano xy. 
x 

v=Í[>]:x=07z0} Bs decin sea W = Í| > | : xy = 0). 

a) Siu y v están en V, ¿está u + v en V? ¿Por qué? a) Si u está en W y c es cualquier escalar, ¿está cu en W? 

b) Encuentre un vector específico u en V y un escalar específico ¿Por qué? 


c tal que cu no esté en V. (Esto es suficiente para demostrar 
que V no es un espacio vectorial). 
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b) Encuentre dos vectores específicos u y v tales que u + v no 
esté en W. Esto es suficiente para demostrar que W no es 
un espacio vectorial. 


3. Sea H el conjunto de puntos en el interior y sobre el círculo uni- 
tario en el plano xy. Es decir, sea H = T] x +y? < 1) 


Encuentre un ejemplo específico —dos vectores o un vector y 
un escalar—, que demuestre que H no es un subespacio de R?. 


4. Construya una figura geométrica que ilustre por qué una recta 
en R? que no pasa por el origen no es cerrada bajo la suma de 
vectores. 


En los ejercicios 5 a 8, determine si el conjunto dado es un subespa- 
cio de P, para un valor adecuado de n. Justifique sus respuestas. 


5. Todos los polinomios de la forma p(t) = at?, donde a se encuen- 
tra en R. 


6. Todos los polinomios de la forma p(t) = a + 1?, donde a se 
encuentra en R. 


7. Todos los polinomios de grado 3 como máximo, con números 
enteros como coeficientes. 


8. Todos los polinomios en [P,, tales que p(0) = 0. 


9. Sea H el conjunto de todos los vectores de la forma St 
3t 


Encuentre un vector v en R? tal que H = Gen {v}. ¿Por qué esto 
demuestra que H es un subespacio de R?? 
3t 
10. Sea H el conjunto de todos los vectores de la forma | 0 |, 
—1t 
donde f es cualquier número real. Demuestre que H es un subes- 
pacio de R°. (Utilice el método del ejercicio 9). 


11. Sea W el conjunto de todos los vectores de la forma 


2b + 3c 
=b , donde b y c son arbitrarios. Encuentre los vec- 
2c 


tores u y v tales que W = Gen {u, v}. ¿Por qué esto demuestra 
que W es un subespacio de R3? 


12. Sea W el conjunto de todos los vectores de la for- 


2s + 4t 
ma 23 . Demuestre que W es un subespacio de R4. 


2s — 3t 
[st] 


(Utilice el método del ejercicio 11). 


1 2 4 3 
13. Sea v; = 0 j.n =| 1j, =|2|ļyw=ļ|1 
—1 3 6 2 


a) ¿Está w en {v1, V2, V3}? ¿Cuántos vectores se encuentran 
en {V1, V2, V3}? 
b) ¿Cuántos vectores están en Gen {v1, V2, V3}? 
c) ¿w es el subespacio generado por {v1, V2, V3}? ¿Por qué? 
1 


14. Sea vi, V2, V3 como en el ejercicio 13, y sea w = 3 
14 


¿Está w en el subespacio generado por {v1, V2, V3}? ¿Por qué? 


En los ejercicios 15 a 18, sea W el conjunto de todos los vectores 
de la forma indicada, donde a, b y c representan números reales 
arbitrarios. En cada caso, encuentre un conjunto S de vectores que 
genere W o dé un ejemplo para demostrar que W no es un espacio 
vectorial. 


2a + 3b 1 
15. —1 16. | 3a — 5b 
2a — 5b 3b + 2a 
2a—b 4a + 3b 
3b- c 0 
17: 3c—a 18: a+3b+ce 
3b 3b — 2c 


19. Si una masa m se coloca en el extremo de un resorte, y si se tira 
de la masa hacia abajo y luego se suelta, el sistema masa-resorte 
comenzará a oscilar. El desplazamiento y de la masa desde su 
posición de reposo está dado por una función de la forma 


y(t) = cı cos wt + c2 sen wt (5) 


donde w es una constante que depende del resorte y la masa. 
(Véase la figura que se muestra a continuación). Demuestre que 
el conjunto de todas las funciones descritas en la ecuación (5) 
(con w fija y c, y cz arbitrarias) es un espacio vectorial. 





20. El conjunto de todas las funciones de valor real continuas y de- 
finidas en un intervalo cerrado [a, b] en R se denota mediante 
Cla, b]. Este conjunto es un subespacio del espacio vectorial de 
todas las funciones de valor real definidas en [a, b]. 


a) ¿Qué hechos acerca de las funciones continuas se deberían 
someter a prueba para demostrar que Cla, b] es en realidad 
el subespacio que se afirma? (Estos hechos se suelen tratar 
en una clase de cálculo). 


b) Demuestre que (f en Cla, b] : f(a) = £(b)) es un subespacio 
de Cla, b]. 


Para enteros positivos fijos m y n, el conjunto M,»x, de todas las ma- 
trices de m x n es un espacio vectorial, bajo las operaciones habi- 
tuales de suma de matrices y multiplicación por escalares reales. 


21. Determine si el conjunto A de todas las matrices de la forma 


| i | es un subespacio de M2x2. 


22. Sea F una matriz fija de 3 x 2, y sea H el conjunto de todas las 
matrices A en M2x4 con la propiedad de que FA = 0 (la matriz 
cero en M3x4). Determine si H es un subespacio de M2x4. 


En los ejercicios 23 y 24, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


23. 


24. 


a) Si f es una función en el espacio vectorial V de todas las 
funciones de valores reales en R y si f(1) = O para alguna t, 
entonces f es el vector cero en V. 


b) Un vector es una flecha en el espacio tridimensional. 


c) Un subconjunto H de un espacio vectorial V es un subes- 
pacio de V si el vector cero está en H. 


d) Un subespacio también es un espacio vectorial. 


e) Las señales analógicas se utilizan en los sistemas de control 
principal del transbordador espacial, mencionado en la in- 
troducción al capítulo. 


a) Un vector es cualquier elemento de un espacio vectorial. 


b) Si u es un vector en un espacio vectorial V, entonces (—1)u 
es igual al negativo de u. 


c) Un espacio vectorial es un subespacio. 
d) R? es un subespacio de R3. 


e) Un subconjunto H de un espacio vectorial V es un subespa- 
cio de V si se cumplen las siguientes condiciones: i. el vector 
cero de V está en H, ii. u, v y u + v en H, y iii. c es un escalar 
y cu está en H. 


Los ejercicios 25 a 29 muestran cómo se pueden utilizar los axiomas 
de un espacio vectorial V para demostrar las propiedades elementales 
descritas después de la definición de un espacio vectorial. Complete 
los espacios en blanco con los números del axioma adecuado. De 
acuerdo con el axioma 2, los axiomas 4 y 5 implican, respectivamen- 
te, que 0 + u = u y —u + u = Q para toda u. 


25. 


26. 


27. 


28. 


Complete la siguiente demostración de que el vector cero 
es único. Suponga que w en V tiene la propiedad de que u + 
w = w + u = u para toda u en V. En particular, 0 + w = 0. 
Sin embargo, 0 + w = w, de acuerdo con el axioma 

Por lo tanto, w = 0 + w = 0. 


Complete la siguiente demostración de que —u es el único 
vector en V tal que u + (—u) = 0. Suponga que w satisface 
u + w = 0. Sumando —u en ambos lados, se tiene 


(—u) + [u + w] = (~u) + 0 


[(—u) + u] + w = (~u) + 0 según el axioma a) 
0+w=(—u)+0 según el axioma b) 
w=-u según el axioma c) 


Complete los números de axioma que faltan en la siguiente de- 


mostración de que 0u = 0 para cada u en V. 
0u = (0 + 0)u = Ou + Ou según el axioma a) 


Sume el negativo de Ou en ambos lados: 


0u + (—0u) = [0u + 0u] + (—0u) 


Ou + (—0u) = Ou + [0u + (—0u)] según el axioma b) 
0=0u+0 según el axioma c) 
0 = 0u según el axioma d) 


Complete los números de axioma que faltan en la siguiente 
demostración de que 


29. 


30. 


31. 


32. 


33. 


34. 
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c0 = 0 para cada escalar c. 
c0 = c(0 + 0) según el axioma a) 
=c0 +c0 según el axioma b) 
Sume el negativo de cÚ en ambos lados: 
c0 + (=c0)=[c0 + c0] + (=c0) 
c0 + (=c0)=c0 + [c0 + (—c0)] según el axioma c) 
0=c0 +0 según el axioma d) 
0=c0 según el axioma e) 
Demuestre que (—1)ju = —u. [Sugerencia: Demuestre que 


u + (-1)u = 0. Utilice algunos axiomas y los resultados de 
los ejercicios 27 y 26]. 


Suponga que cu = () para algún escalar c distinto de cero. 
Demuestre que u = 0. Mencione los axiomas o las propiedades 
que utilice. 


Sean u y v vectores en un espacio vectorial V, y sea H cual- 
quier subespacio de V que contiene a u y v. Explique por qué H 
también contiene a Gen {u, v}. Esto demuestra que Gen {u, v} 
es el menor subespacio de V que contiene a u y v. 


Sean H y K subespacios de un espacio vectorial V. La inter- 
sección de H y K, que se representa como H N K, es el conjun- 
to de v en V que pertenece tanto a H como K. Demuestre que 
H N K es un subespacio de V. (Véase la figura). Dé un ejemplo 
en R? para demostrar que la unión de dos subespacios no es, en 
general, un subespacio. 


Dados los subespacios H y K de un espacio vectorial V, la suma 
de H y K, que se escribe como H + K, es el conjunto de todos 
los vectores en V que se pueden representar como la suma de 
dos vectores, uno en H y el otro en K; es decir, 


H + K = {w:w = u + v para alguna u en H 
y alguna v en K} 
a) Demuestre que H + K es un subespacio de V. 


b) Demuestre que H es un subespacio de H + K y K es un 
subespacio de H + K. 


Suponga que u;,..., U, Y V;,..., V¿SON Vectores en un espacio 
vectorial V, y sea 


H = Gen {u;,..., up} y K = Gen [v1,..., Vg} 


Demuestre que H + K = Gen {u1,..., Up, V1,- Va). 
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35. 


36. 


37. 


4.2 


[M] Demuestre que w está en el subespacio de R4 generado por 
V1, V2, V3, donde 


9 8 —4 —7 
aea al el 
Aa A A p a s 
a ll el Ls 
[M] Determine si y está en el subespacio de R? generado por las 
columnas de A, donde 


-4 oO 
=8 8 7 —6 
I= e AE eg a 
ES DD 


[M] El espacio vectorial A = Gen (1, cos?t, cost, cosór) con- 
tiene al menos dos funciones interesantes que se utilizarán en un 


38. 


ejercicio posterior: 


f(t) = 1 — 8 cos? t + 8 cost t 
g(t) = —1 + 18 cos? t — 48 cost t + 32 cos! £ 


Estudie la gráfica de f para O < t S 27, e infiera una fórmula 
sencilla para f(t). Verifique su suposición mediante la represen- 
tación gráfica de la diferencia entre 1 + f(t) y su fórmula para 
f(t). (Se espera que vea la función constante 1). Repita el pro- 
cedimiento para g. 


[M] Repita el ejercicio 37 para las funciones 
f(t) = 3 sen t — 4 sen? t 

g(t) = 1 — 8 sen? 1 + 8 sent 1 

h(1) = 5 sent — 20 sen? 1 + 16 sen! £ 


en el espacio vectorial Gen (1, sen £, sen?t,..., senor). 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Tome cualquier u en H, digamos, u = | 


Así, cu = la 


7 | y tome cualquier c + 1, por ejemplo, c = 2. 


6| a 
. Si esto se encuentra en H, entonces hay alguna s tal que 


[ets = [i] 


Es decir, s = 2 y s = 12/5, lo que es imposible. Así que 2u no está en H, y H no es un 


espacio vectorial. 


2. vı = lv; + 0v2 + = + 0v,. Esta ecuación expresa a vı como una combinación lineal 
de vı,..., Vp, por lo que vı se encuentra en W. En general, vg está en W, ya que 


vk = Ov1 +++ + O0vk—1 + lvk + Ovx41 ++“. +0v, 


ESPACIOS NULOS, ESPACIOS COLUMNA Y TRANSFORMACIONES LINEALES 


En las aplicaciones del álgebra lineal, los subespacios de R” generalmente se presentan en 
una de dos maneras: 1. como el conjunto de todas las soluciones a un sistema de ecuaciones 
lineales homogéneas, o 2. como el conjunto de todas las combinaciones lineales de ciertos 
vectores específicos. En esta sección, se comparan estas dos descripciones de subespacios, 
lo que nos permitirá practicar el uso del concepto de subespacio. En realidad, como pronto 
descubrirá, hemos trabajado con subespacios desde la sección 1.3. La principal novedad aquí 
es la terminología. La sección concluye con un análisis acerca del núcleo y el rango de una 


transformación lineal. 


El espacio nulo de una matriz 


Considere el siguiente sistema de ecuaciones homogéneas: 


Xi — 3x2 — 2x3; = 0 


(1) 


—5x1+%%+ x3=0 
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En forma de matriz, este sistema se representa como Ax = 0, donde 


1-3 2 
a=[; 9 i (2) 


Recordemos que el conjunto de todas las x que satisfacen (1) se llama el conjunto solución 
del sistema (1). Con frecuencia es conveniente relacionar este conjunto directamente con la 
matriz A y la ecuación Ax = 0. El conjunto de x que satisfacen Ax = O se denomina el espacio 
nulo de la matriz A. 


DEFINICIÓN El espacio nulo de una matriz A de m x n, que se denota como Nul A, es el conjunto de 
todas las soluciones de la ecuación homogénea Ax = 0. En notación de conjuntos, 


Nul A = {x : x está en R” y Ax = 0} 


Una descripción más dinámica de Nul A es el conjunto de todas las x en R” que se ma- 
pean en el vector cero de R” a través de la transformación lineal x > Ax. Véase la figura 1. 


Ae 
we 
DA? , 
e Nn, 
FIGURA 1 
5 
EJEMPLO 1 Sea A la matriz en la ecuación (2) anterior, y sea u = 3 |. Determine 
—2 
si u pertenece al espacio nulo de A. 
SOLUCIÓN Para probar si u satisface Au = 0, simplemente se calcula 
5 
Au=| 1 3 -2 3 |= 5- 94+4]|_]J0 
ales es Al 212510 
Por lo tanto, u está en Nul A. a 


El término espacio en el espacio nulo es adecuado ya que el espacio nulo de una matriz 
es un espacio vectorial, como se muestra en el siguiente teorema. 


TEOREMA 2 El espacio nulo de una matriz A de m x n es un subespacio de R”. De manera equiva- 
lente, el conjunto de todas las soluciones a un sistema Ax = 0 de m ecuaciones lineales 
homogéneas con n incógnitas es un subespacio de R”. 
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DEMOSTRACIÓN Sin duda, Nul A es un subconjunto de R” porque A tiene n columnas. 
Debemos demostrar que Nul A satisface las tres propiedades de un subespacio. Desde luego, 
0 está en Nul A. Ahora, considere que u y v representan los dos vectores de Nul A. De esta 
forma, 


Au=0 y Av=0 


Para demostrar que u + v está en Nul A, se tiene que demostrar que A(u + v) = 0. Utilizando 
una propiedad de multiplicación de matrices, calcule 


A(u +v)=Au+Av=0+0=0 


Por lo tanto, u + v está en Nul A, y Nul A es cerrado bajo la suma de vectores. Por último, 
si c es un escalar cualquiera, entonces 


A(cu) = c(Au) = c(0) = 0, 
lo que demuestra que cu está en Nul A. Así, Nul A es un subespacio de R”. E 
EJEMPLO 2 Sea H el conjunto de los vectores en R* cuyas coordenadas a, b, c, d sa- 


tisfacen las ecuaciones a — 2b + 5c = d, y c — a = b. Demuestre que A es un subespacio 
de R4. 


SOLUCIÓN Al reordenar las ecuaciones que describen los elementos de H, y al observar 
que H es el conjunto de todas las soluciones del siguiente sistema de ecuaciones lineales 


homogéneas: 
a—2b+5c-d=0 
—a— b+ c =0 
De acuerdo con el teorema 2, H es un subespacio de R4. E 


Es importante hacer notar que las ecuaciones lineales que definen el conjunto H son ho- 
mogéneas. De lo contrario, el conjunto de soluciones no será definitivamente un subespacio 
(porque el vector cero no es una solución de un sistema no homogéneo). Además, en algunos 
casos, el conjunto de soluciones podría estar vacío. 


Una descripción explícita de Nul A 


No hay una relación evidente entre los vectores en Nul A y las entradas de A. Se dice que 
Nul A se define de forma implícita, ya que se define por una condición que se debe compro- 
bar. No existe una lista o una descripción explícitas de los elementos de Nul A. Sin embargo, 
resolver la ecuación Ax = 0 equivale a hacer una descripción explícita de Nul A. El siguiente 
ejemplo revisa el procedimiento de la sección 1.5. 


EJEMPLO 3 Determine un conjunto generador del espacio nulo de la matriz 


-3 6-1 1-7 
A=| 1-2 2 3-1 
2—4 5 8—4 


SOLUCIÓN El primer paso es encontrar la solución general de Ax = 0 en términos de va- 
riables libres. Reduzca por filas la matriz aumentada [4 0] a la forma escalonada reducida 
para escribir las variables básicas en términos de las variables libres: 


1-2 0-1 3. 0 xı — 2x2 = x4+3xs=0 
0 0 1 22 0l, x3 + 2x4 — 2x5 = 0 
0 0 0 0 0 0 0=0 


DEFINICIÓN 


TEOREMA 3 
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La solución general es xı = 2x2 + x4 — 3x5, x3 = —2x4 + 2x5, CON X2, X4 y xs libres. 
Luego, hay que descomponer el vector que da la solución general en una combinación li- 
neal de vectores donde los pesos son las variables libres. Es decir, 


X1 2x2 + x4 — 3x5 2 1 —3 
X2 X2 1 0 0 
x3 | = —2x4 + 2x5 = x2| 0 | +x4| —2 | + x5 2 
X4 X4 0 1 0 
X5 X5 (0) 0 1 
1 1 1 
u v WwW 
= XU + xX4V + X5W (3) 


Cada combinación lineal de u, v y w es un elemento de Nul A. Por lo tanto, {u, v, w} es un 
conjunto generador para Nul A. E 


Hay que hacer notar dos hechos acerca de la solución del ejemplo 3 que se aplican a 
todos los problemas de este tipo, donde Nul A contiene vectores distintos de cero. Vamos 
a considerar estos datos más adelante. 


1. El conjunto generador producido por el método del ejemplo 3 es linealmente indepen- 
diente de manera automática debido a que las variables libres son los pesos de los vectores 
generados. Por ejemplo, vea la segunda, cuarta y quinta entradas en el vector solución en 
la ecuación (3) y observe que x2u + x4v + x5w puede ser 0 solo si los pesos x2, x4 y X5 son 
todos cero. 


2. Cuando Nul A contiene vectores distintos de cero, el número de vectores en el conjunto 
generador para Nul A es igual al número de variables libres en la ecuación Ax = 0. 


El espacio columna de una matriz 


Otro subespacio importante asociado con una matriz es el espacio columna. A diferencia 
del espacio nulo, el espacio columna se define de forma explícita a través de combinaciones 
lineales. 


El espacio columna de una matriz A de m x n, que se denota como Col A, es el conjunto 
de todas las combinaciones lineales de las columnas de A. Si A = [a; -*- a,], entonces 


Col A = Gen (aj,..., an) 


Ya que Gen {a;,..., an} es un subespacio, de acuerdo con el teorema 1, el siguiente teore- 
ma se deduce de la definición de Col A y del hecho de que las columnas de A están en R”. 


El espacio columna de una matriz A de m x n es un subespacio de R”. 


Observe que un vector típico de Col A se puede escribir como Ax para alguna x, ya que la 
notación Ax representa una combinación lineal de las columnas de A. Es decir, 


Col A = {b : b = Ax para alguna x en R”} 


La notación Ax para los vectores en Col A también muestra que A es el rango de la transfor- 
mación lineal x > Ax. Regresaremos a este punto de vista al final de la sección. 
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Xx 


EJEMPLO 4 Encuentre una matriz A tal que W = Col A. 
6a — b 


W = a+b |:a,benR 
—7a 


SOLUCIÓN En primer lugar, escriba W como un conjunto de combinaciones lineales. 


6 Sl 6 -1 
W=:xa 1 | +b l|:a,benR+= Gen 11, 
—7 0 —7 


En segundo lugar, utilice los vectores en el conjunto generador como las columnas de A. 


6 —1 
Sea A = 1 1 |. De esta forma, W = Col A, como se desea. E 
-7 0 


Recuerde el teorema 4 de la sección 1.4, según el cual las columnas de A generan a R” 
si y solo si la ecuación Ax = b tiene una solución para cada b. Podemos enunciar este hecho 
con palabras de la siguiente manera: 


El espacio columna de una matriz A de m x n es R” si y solo si la ecuación Ax = b tiene 
una solución para cada b en R”. 


Contraste entre Nul A y Col A 


Es natural preguntarse cómo se relacionan el espacio nulo y el espacio columna de una matriz. 
De hecho, los dos espacios son muy diferentes, como se constata en los ejemplos 5 a 7. Sin 
embargo, una sorprendente conexión entre el espacio nulo y el espacio columna se verá en la 
sección 4.6, cuando hayamos estudiado más teoría. 


EJEMPLO 5 Sea 


2 4-2 1 
A=|-2-5 7 3 
3 7—8 6 


a) Si el espacio columna de A es un subespacio de R$, ¿a qué es igual k? 


b) Si el espacio nulo de A es un subespacio de R$, ¿a qué es igual k? 


SOLUCIÓN 


a) Cada una de las columnas de A tiene tres entradas, por lo que Col A es un subespacio 
de R*, donde k = 3. 


b) Un vector x tal que Ax esté definido debe tener cuatro entradas, por lo que Nul A es un 
subespacio de R*, donde k = 4. E 


Cuando una matriz no es cuadrada, como en el ejemplo 5, los vectores en Nul A y 
Col A viven en “universos” totalmente diferentes. Por ejemplo, ninguna combinación li- 
neal de vectores en R? puede producir un vector en R4. Cuando A es cuadrada, Nul A y 
Col A tienen el vector cero en común, y en casos especiales es posible que algunos vectores 
diferentes de cero pertenezcan tanto a Nul A como a Col A. 
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EJEMPLO 6 Con A como en el ejemplo 5, encuentre un vector diferente de cero en Col 
A y otro en Nul A. 
SOLUCIÓN Es fácil encontrar un vector en Col A. Cualquier columna de A lo permite, 


2 
por ejemplo, | —2 [. Para encontrar un vector distinto de cero en Nul A, al reducir por filas 
3 


la matriz aumentada [A 0] se obtiene 


1 0 9 Ọ0 0 
[A OJ~]|O 1—5 0 0 
0.0 0 1-0 
Por lo tanto, si x satisface Ax = 0, entonces xı = —9x3, x2 = 5x3, x4 = 0, y x3 es libre. 
Al asignar un valor distinto de cero para x3, por ejemplo, x3 = 1, se obtiene un vector de 
Nul A, a saber, x = (—9, 5, 1, 0). E 
dy 3 
EJEMPLO 7 Con A como en el ejemplo 5, sean u = ARS -1 
3 
0 


a) Determine si u está en Nul A. ¿Podría u estar en Col A? 
b) Determine si v está en Col A. ¿Podría v estar en Nul A? 


SOLUCIÓN 


a) Una descripción explícita de Nul A no es necesaria aquí. Basta con calcular el pro- 
ducto Au. 


2 4-2 1 a 0 0 
du=|-2 3 7 3|||=|=]|A4]|0 
eS la 3 0 


Evidentemente, u no es una solución de Ax = 0, por lo que u no está en Nul A. Además, 
con cuatro entradas, u no podría estar en Col A, ya que Col A es un subespacio de [R?. 


b) Se reduce [A v] a una forma escalonada. 


ADS 2 4-2 1 3 
[A v]=]|-2 -5 7 3-~-1ļ~]|0 1 -5 —4 -2 
3 7—8 6 3 0 0 017 1 


En este punto, es claro que la ecuación Ax = v es consistente, por lo que v está en 
Col A. Con solo tres entradas, v no podría estar en Nul A, ya que Nul A es un subespacio 
de R4. E 


La tabla de la página 204 resume lo que hemos aprendido acerca de Nul A y Col A. 
El punto 8 es una nueva formulación de los teoremas 11 y 12a) de la sección 1.9. 


Núcleo y rango de una transformación lineal 


Otros subespacios de espacios vectoriales diferentes de R” con frecuencia se describen en 
términos de una transformación lineal y no de una matriz. Con la finalidad de precisar esto, 
generalizamos la definición que dimos en la sección 1.8. 
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DEFINICIÓN 


Comparación entre Nul A y Col A para una matriz A de m x n 


Nul A 


Col A 





1. Nul A es un subespacio de R”. 


2. Nul A se define implícitamente, es decir, solo 
estableciendo una condición (Ax = 0) que los 
vectores de Nul A deben satisfacer. 

3. Se necesita tiempo para encontrar vectores de 
Nul A. Se requiere efectuar operaciones de fila 
en [A 0]. 

4. No hay una relación evidente entre Nul A y las 
entradas de A. 


5. Un vector típico v de Nul A tiene la propiedad 
de que Av = 0. 

6. Dado un vector específico v, es fácil saber si y 
está en Nul A. Solo hay que calcular Av. 


7. Nul A = {0} si y solo si la ecuación Ax = 0 
tiene solamente la solución trivial. 

8. Nul A = {0} si y solo si la transformación li- 
neal x > Ax es de uno a uno. 


1. Col A es un subespacio de R”. 


2. Col A se define explícitamente, es decir, se in- 


dica cómo construir vectores en Col A. 


. Es fácil encontrar vectores en Col A. Las co- 


lumnas de A se muestran, y las otras se forman 
a partir de ellas. 


. Existe una relación evidente entre Col A y las 


entradas de A, ya que cada columna de A está 
en Col A. 


. Un vector típico v en Col A tiene la propiedad 


de que la ecuación AX = v es consistente. 


. Dado un vector específico v, puede tomar al- 


gún tiempo saber si v está en Col A. Se requie- 
ren operaciones de fila en [A_v]. 





. Col A = R” si y solo si la ecuación Ax = b 


tiene una solución para toda b en R”. 











. Col A = R” si y solo si la transformación li- 


neal x —> Ax mapea R” sobre R”. 


Una transformación lineal T de un espacio vectorial V en un espacio vectorial W 
es una regla que asigna a cada vector x en V un único vector T(x) en W, tal que 


i. T(u + v) = T(u) + T(v) 
ii. T(cu) = cT(u) 


para toda u, v en V, y 


para toda u en V y todo escalar c. 


El núcleo (o espacio nulo) de dicha T es el conjunto de todas las u en V tales que 
T(u) = 0 (el vector cero en W). El rango de T es el conjunto de todos los vectores en W 
de la forma T(x) para alguna x en V. Si ocurre que T surge como una transformación matri- 
cial, por ejemplo, T(x) = Ax para alguna matriz A, entonces el núcleo y la imagen de T son 
solo el espacio nulo y el espacio columna de A, como se definió anteriormente. 

No es difícil demostrar que el núcleo de T es un subespacio de V. La demostración es, 
en esencia, la misma que para el teorema 2. Además, el rango de T es un subespacio de W. 


Véase la figura 2 y el ejercicio 30. 


jo 
¡0 
paz 
e mA 
le 


«0 


El núcleo es un 
subespacio de V 


El rango es un 
subespacio de W 





FIGURA 2 Subespacios asociados con 
una transformación lineal. 


En aplicaciones, un subespacio suele surgir ya sea como el núcleo, o bien, como el ran- 
go de una transformación lineal adecuada. Por ejemplo, el conjunto de todas las soluciones 
de una ecuación diferencial lineal homogénea resulta ser el núcleo de una transformación 


lineal. 


4.2 


1. Determine si w = 


Az 


EJERCICIOS 


3 
6 
—8 


—5 
—2 
4 


1 
3 
-4 


=3 
0 |. 
1 


4.2 Espacios nulos, espacios columna y transformaciones lineales 205 


En general, una transformación lineal de este tipo se describe en términos de una o más deri- 
vadas de una función. Explicar esto en detalle nos llevaría demasiado lejos en este momento, 
por lo que consideramos solo dos ejemplos. El primero explica por qué la operación de dife- 
renciación es una transformación lineal. 


EJEMPLO 8 (Requiere conocimientos de cálculo) Sea V el espacio vectorial de todas 
las funciones de valores reales f definidas en un intervalo [a, b] con la propiedad de que 
son diferenciables, y sus derivadas son funciones continuas en [a, b]. Sea W el espacio vec- 
torial C[a, b] de todas las funciones continuas en [a, b], y sea D : V —> W la transfor- 
mación que cambia a fen V en su derivada f”. En cálculo, dos reglas sencillas de la diferen- 
ciación son 


D(f +8) =D) +D) y DCf)=cD) 


Es decir, D es una transformación lineal. Es posible demostrar que el núcleo de D es el 
conjunto de las funciones constantes en [a, b] y el rango de D es el conjunto W de todas 
las funciones continuas en [a, b]. Al 


EJEMPLO 9 (Requiere conocimientos de cálculo) La ecuación diferencial 
y” +wy=0, (4) 


donde w es una constante, se utiliza para describir una variedad de sistemas físicos, tales 
como la vibración de un resorte del que pende un peso, el movimiento de un péndulo, y el 
voltaje en un circuito eléctrico de inductancia-capacitancia. El conjunto de soluciones de (4) 
es precisamente el núcleo de la transformación lineal que mapea una función y = f(t) en la 
función de f”(t) + «w?f(t). Encontrar una descripción explícita de este espacio vectorial es 
un problema de ecuaciones diferenciales. El conjunto solución resulta ser el espacio descrito 
en el ejercicio 19 de la sección 4.1. A 


PROBLEMAS DE PRÁCTICA 


a 
1. Sea W = b | :a— 3b — c = 0 $. Demuestre de dos maneras diferentes que W es 
c 


un subespacio de R?. (Utilice dos teoremas). 


7-3 5 2 7 
2. Sea A=|-4 1 -5|,v= l|y w= 6 |. Suponga que sabe que las 
-5 2 —4 -1 3 


ecuaciones Ax = v y Ax = w son consistentes. ¿Qué puede decir acerca de la ecuación 
Ax=v+w? 


1 


está en Nul A, donde 2. Determine si w= | —1 | está en Nul A, donde 
1 
2 6 4 
A=|-3 2 9 
—5 —4 1 
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En los ejercicios 3 a 6, encuentre una descripción explícita de Nul A, 21. Con A como en el ejercicio 17, encuentre un vector distinto de 
haciendo una lista de vectores que generan el espacio nulo. cero en Nul A y otro en Col A. 
3. A= 1 2 4 Ọ0 22. Con A como en el ejercicio 18, encuentre un vector distinto 
f Jo 1 3-2 de cero en Nul A y otro en Col A. 
E 2 4 2 ; . 
4. a=|, A a J 23. Sea oE Jars] Determine si w está en 
¿Está ? 
1-4 0 2 0 Col A. ¿Está w en Nul A? 
5. A=|0 0 1-5 0 10 8 -2 6 A 
0o 0 0 0 2 0 2 2 -2 2 e 
24. Sea A = 1a 6 o "=lolt Determine si w 
1 3 -4 -3 1 1 1 0 2 2 
6 A=|0 1 -3 1 0 
0 0 0 0 0 está en Col A. ¿Está w en Nul A? 


En los ejercicios 25 y 26, A denota una matriz de m x n. Marque cada 


En los ejercicios 7 a 14, utilice un teorema adecuado para demostrar 4 7 
enunciado como verdadero o falso. Justifique sus respuestas. 


que el conjunto dado, W, es un espacio vectorial, o bien, encuentre un 


ejemplo específico de lo contrario. 25. a) El espacio nulo de A es el conjunto solución de la ecuación 
Ax =0. 
a r 
7. bl:a+b+c=2 $. s|:3r-2=3s+1 b) El espacio nulo de una matriz de m x n está en R”. 
E c) El espacio columna de A es el rango del mapeo x > Ax. 
| p ] d) Si la ecuación Ax = b es consistente, entonces Col A es R”. 
9. 4|, P— 3q = 4s .Ja+b=c e) El núcleo de una transformación lineal es un espacio 
2p=s+5r “a+b+2c=2d vectorial. 
s 
f) Col A es el conjunto de todos los vectores que se pueden 
s—2t 3 A a escribir como Ax para alguna x. 
11. , +35 : s. t reales : p, q reales 26. a) Un espacio nulo es un espacio vectorial. 
s +1 ? ? 
25 q d 1 b) El espacio columna de una matriz de m x n está en R”. 
c) Col A es el conjunto de todas las soluciones de Ax = b. 
c— 6d —s + 3t 
13 d vevd reales s-ar reai tenles d) Nul A es el núcleo del mapeo x > Ax. 
c 5s —t e) El rango de una transformación lineal es un espacio 


vectorial. 
En los ejercicios 15 y 16, encuentre A tal que el conjunto dado 


Col A f) El conjunto de todas las soluciones de una ecuación dife- 
dd rencial lineal homogénea es el núcleo de una transformación 
25+1 lineal. 
r=s+21 : 16 i 
. iT, S, . Es posible demostrar que una solución del sistema que se mues- 
15 airs : F, S, t reales 27. Es posible d trar q 1 del sist q 
e tra a continuación es xy = 3, x, = 2, y x3 = —1. Con base en 
este hecho y en la teoría de esta sección, explique por qué otra 
b=c solución es xı = 30, x2 = 20, y x3 = —10. (Observe cómo están 
2b + 3d relacionadas las soluciones, pero no realice otros cálculos). 
16. PS 3d |: b, c, d reales 
+ 3c — xı — 3x2 — 3x3 = 0 
c+d 
—2X1 + 4x2 + 2x3 =0 
Para las matrices de los ejercicios 17 a 20, a) encuentre k tal que —x1 + 5x2 + 7x3 =0 
Nul A sea un subespacio de R*, y b) encuentre k tal que Col A sea 
un subespacio de RY. 28. Considere los siguientes dos sistemas de ecuaciones: 
6 —4 5 —2 d 5x1 + X2 — 3x3 = 0 5xı + X2 — 3x3 = 
17. A= E 18. A= E > —9x1 + 2x2 + 5x3 = 1 91 +2x2+5%3= 5 
a Se 2 e e 4x1 + x — 6x3 =9 Ax + x2 — 6x3 = 45 
4 52 6 0 Es posible demostrar que el primer sistema tiene una solución. 
19. A= | 1 1 0 1 Al Con base en este hecho y en la teoría de esta sección, explique 


por qué el segundo sistema también debe tener una solución. 
20. A=[l -3 2 O -—5] (No realice operaciones de fila). 


29. 


30. 


31. 


32. 


33. 


34. 
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Demuestre el teorema 3 de la siguiente manera: dada una matriz 
A de m x n, un elemento de Col A tiene la forma Ax para alguna 
x en R”. Sean Ax y Aw dos vectores cualesquiera en Col A. 


a) Explique por qué el vector cero está en Col A. 

b) Demuestre que el vector Ax + Aw está en Col A. 

c) Dado un escalar c, demuestre que c(Ax) está en Col A. 

Sea T : V — W una transformación lineal de un espacio vectorial 
V en un espacio vectorial W. Demuestre que el rango de T es 
un subespacio de W. [Sugerencia: Considere que los elementos 


típicos del rango tienen la forma T(x) y T(w) para alguna x, w 
en V]. 


Defina T : P) —> R? mediante T (p) = 1 | Por ejemplo, 


si p(t) = 3 + 51 + 78, entonces T(p) = | | 





a) Demuestre que T es una transformación lineal. [Sugerencia: 
Para polinomios arbitrarios p, q en [P,, calcule T(p + q) 


y T(cp)]. 
b) Encuentre un polinomio p en [P, que genere el núcleo de T 
y describa el rango de T. 


Defina una transformación lineal T : P) —> R? mediante 


T(p) = Po | Determine los polinomios pı y p2 en Pz que 


generan el núcleo de T, y describa el rango de T. 


Sea M2x2 el espacio vectorial de todas las matrices de 2 x 2, y 
defina T : M2x2 —> M2x2 mediante T(A) = A + AT, donde 


ee 


a) Demuestre que T es una transformación lineal. 


b) Sea B cualquier elemento de M2x2 tal que BT = B. Determine 
una Á en Max tal que T(4) = B. 


c) Demuestre que el rango de Tes el conjunto de B en Mx con 
la propiedad de que BT = B. 


d) Describa el núcleo de T. 


(Se requiere cálculo) Defina a T : C[0, 1] —> C[0, 1] como 
sigue: Para f en C[0, 1], sea T(£) la antiderivada F de f tal 
que F(0) = 0. Demuestre que T es una transformación lineal, 
y describa el núcleo de T. (Véase la notación en el ejercicio 20 
de la sección 4.1). 


35. 


36. 


37. 


38. 


39. 


40. 
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Sean V y W espacios vectoriales, y sea T : V —> W una trans- 
formación lineal. Dado un subespacio U de V, sea T(U) el 
conjunto de todas las imágenes de la forma T(x), donde x está 
en U. Demuestre que T(U) es un subespacio de W. 


Dada T : V —> W como en el ejercicio 35, y dado un subespa- 
cio Z de W, sea U el conjunto de todas las x en V tales que T(x) 
está en Z. Demuestre que U es un subespacio de V. 


[M] Determine si w está en el espacio columna de A, en el espa- 
cio nulo de A, o en ambos, donde, 


1 eo Y 
1 O y 
Mare As o a 
-3 19 -9 7 1 


[M] Determine si w está en el espacio columna de A, en el es- 
pacio nulo de A, o en ambos, donde, 


1 —8 52 0 
2 =5 2 1 —2 
w=|iþp 4=| 10 -8 6 3 
0 3 —2 1 0 
[M] Considere que a;,..., as denotan las columnas de la ma- 
triz A, donde 
5 1 2.2 0 
3 3 2 -1 -12 
tal 4 aces» PAL a a] 
2 1 1 0 -—2 


a) Explique por qué a; y as están en el espacio columna de B. 
b) Encuentre un conjunto de vectores que genere a Nul A. 
c) Sea T : R — R4 definida por T(x) = Ax. Explique por qué 


T no es uno a uno ni sobre. 


[M] Sea H = Gen {v1, v2} y K = Gen {v3, v4}, donde 


5 1 2 0 
vy=]|3|v2=]|3|,vw3=|-—1 |,vw=]|-12 
8 4 5 —28 


Entonces, H y K son subespacios de ¡R*. De hecho, H y K son 
planos en R? que pasan por el origen, y que se cruzan en una 
recta que pasa por 0. Encuentre un vector w distinto de cero que 
genere esa recta. [Sugerencia: w se puede escribir como c1Vı + 
c2V2 y también como c3V3 + c4V4. Para construir w, resuelva la 
ecuación c1Vı + C2V2 = C3V3 + C4V4 para las incógnitas c;]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Primer método: W es un subespacio de R? de acuerdo con el teorema 2, ya que W es 
el conjunto de todas las soluciones de un sistema de ecuaciones lineales homogéneas 
(donde el sistema solamente tiene una ecuación). De manera equivalente, W es el es- 


pacio nulo de la matriz de 1 x 3, A = [1 


-3 il 
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Segundo método: Resuelva la ecuación a — 3b—c = O para la variable principal a en tér- 


3b+c 
minos de las variables libres b y c. Cualquier solución tiene la forma b , donde 
c 


b y c son arbitrarias, y 


3b+c 3 1 
b =b|1|+c|0 

c 0 1 

1 1 

Vi V2 


Este cálculo muestra que W = Gen (vi, v2). Por lo tanto, W es un subespacio de R$ 
de acuerdo con el teorema 1. También se podría despejar b o c de la ecuación a — 3b — 
c =0 y obtener descripciones alternativas de W como un conjunto de combinaciones 
lineales de dos vectores. 


2. Tanto v como w están en Col A. Ya que Col A es un espacio vectorial, v + w debe estar 
en Col A. Es decir, la ecuación Ax = v + w es consistente. 


4.3 | CONJUNTOS LINEALMENTE INDEPENDIENTES; BASES 


TEOREMA 4 


En esta sección identificaremos y estudiaremos los subgrupos que generan un espacio vec- 
torial V o un subespacio H tan “eficientemente” como sea posible. La idea clave es la de 
independencia lineal, definida como en R”. 

Se dice que un conjunto indexado de vectores {v1,..., Vp} en V es linealmente indepen- 
diente si la ecuación vectorial 


C1V1 + C2V2 ++: +Cpvp =0 (1) 


tiene solamente la solución trivial, c1 = 0,..., Cp = 0.! 

Se dice que el conjunto {V1,..., Vp} es linealmente dependiente si (1) tiene una solución no 
trivial, es decir, si hay algunos pesos, c1,..., Cp, nO todos cero, tales que la ecuación (1) sea váli- 
da. En tal caso, la ecuación (1) se llama una relación de dependencia lineal entre v;,..., Vp. 

Al igual que en R”, un conjunto que contiene un único vector v es linealmente indepen- 
diente si y solo si v # 0. Además, un conjunto de dos vectores es linealmente dependiente 
si y solo si uno de los vectores es un múltiplo del otro. Y cualquier conjunto que contenga al 
vector cero es linealmente dependiente. El siguiente teorema tiene la misma demostración 
que el teorema 7 de la sección 1.7. 


Un conjunto indexado {v1,..., Vp} de dos o más vectores, con v; # 0, es linealmente 
dependiente si y solo si alguna v; (con j > 1) es una combinación lineal de los vectores 
anteriores, V1,..., Vj-1- 


La principal diferencia entre la dependencia lineal en R” y en un espacio vectorial ge- 
neral es que cuando los vectores no son n-adas, la ecuación homogénea (1), por lo general, 
no se puede escribir como un sistema de n ecuaciones lineales. Es decir, los vectores no se 
pueden convertir en las columnas de una matriz A con la finalidad de estudiar la ecuación 
Ax = 0). En vez de ello, debemos utilizar la definición de dependencia lineal y el teorema 4. 


EJEMPLO 1 Sea pi(0) = 1, px(0) = t y “(À = 4 — t. Entonces, {P1, p2, p3} es lineal- 
mente dependiente en [P debido a pz = 4p; — p». E 


1 Es conveniente utilizar c1,..., Cp en la ecuación (1) para los escalares en vez de x1,..., xp, Como lo hicimos en el 
capítulo 1. 


DEFINICIÓN 


e 





e, 


A A 
Xi 


FIGURA 1 
La base estándar para R3. 
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EJEMPLO 2 El conjunto {sen t, cos t} es linealmente independiente en C[0, 1], el espa- 
cio de todas las funciones continuas en O = f = 1, porque sen f y cos t no son múltiplos entre 
sí como vectores en C[O, 1]. Es decir, no hay escalar c tal que cos t = c + sen t para toda f en 
[0, 1]. (Véase las gráficas de sen 1 y cos £). Sin embargo, [sen £ cos £, sen 21) es linealmente 
dependiente debido a la identidad: sen 2f = 2 sen £ cos t, para toda t. E 


Sea H un subespacio de un espacio vectorial V. Un conjunto indexado de vectores 
B = (b;,..., b,) en Ves una base de A si 


i. B es un conjunto linealmente independiente, y 


ii. el subespacio generado por B coincide con H, es decir, 


H = Gen (b,..., b,) 


La definición de una base se aplica al caso en que H = V, ya que cualquier espacio 
vectorial es un subespacio de sí mismo. Así, una base de V es un conjunto linealmente inde- 
pendiente que genera a V. Observe que cuando H + V, la condición ii incluye el requisito 
de que cada uno de los vectores b,,..., b, debe pertenecer a H, porque Gen (b,,..., b,) con- 


tiene a b,,..., b,, como se muestra en la sección 4.1. 


EJEMPLO 3 SeaA una matriz invertible de n x n, por ejemplo, A = [a¡ -*- a,]. Entonces, 
las columnas de A forman una base para R”, ya que son linealmente independientes y gene- 
ran a R”, por el teorema de la matriz invertible. E 


EJEMPLO 4 Sean e;,..., e, las columnas de la matriz identidad Z, de n x n. Es decir, 


1 0 0 
0 1 
€l ==, 3 e2 = . > > en = 
0 0 1 
El conjunto (fe;,..., €, ) se llama la base estándar para R” (figura 1). E 
3 —4 —2 
EJEMPLO 5 Sean vı = 0 |, vo = l ly v= 1 |. Determine si {v1, V2, V3} 
—6 7 5 


es una base para R?. 


SOLUCIÓN Puesto que hay exactamente tres vectores aquí en R3, se puede utilizar cual- 
quiera de los diversos métodos para determinar si la matriz A = [v¡ v2 v3] es invertible. Por 
ejemplo, dos remplazos de fila revelan que A tiene tres posiciones pivote. Por lo tanto, A es 
invertible. Como en el ejemplo 3, las columnas de A forman una base para R3. E 


EJEMPLO 6 SeaS= [1, £, 1?,..., 1”). Compruebe que S es una base para P,.. Esta base 
se llama la base estándar para P,. 


SOLUCIÓN Sin duda, $ genera a P,. Para demostrar que S es linealmente independiente, 
suponga que Co,..., C, satisfacen 


co-1+ cit +e? +- + cent” =0(0) (2) 


Esta igualdad significa que el polinomio de la izquierda tiene los mismos valores que el 
polinomio cero de la derecha. Un teorema fundamental del álgebra dice que el único polinomio 
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FIGURA 2 
La base estándar para P3. 





TEOREMA 5 


en [P,,, con más de n ceros es el polinomio cero. Es decir, la ecuación (2) se cumple para to- 
das las f solo si cy = :*: = Cy = 0. Esto demuestra que S es linealmente independiente y, 
por lo tanto, es una base para P,,. Véase la figura 2. E 


Problemas relacionados con la independencia lineal y la generación en [P,, se manejan 
mejor con una técnica que se analizará en la sección 4.4. 


El teorema del conjunto generador 


Como se verá, una base es un “eficiente” conjunto generador que no contiene vectores inne- 
cesarios. De hecho, una base se construye a partir de un conjunto generador descartando los 
vectores innecesarios. 


EJEMPLO 7 Sean 


0 2 6 
v= 21 v=]|2|, v=| 16 y H= Gen (vi, va, V3). 
—1 0 —5 


Considere que v3 = 5v; + 3v2, y demuestre que Gen {v1, V2, V3} = Gen {v1, V2}. Luego, 
encuentre una base para el subespacio H. 


SOLUCIÓN Cada vector en Gen {v1, V2} pertenece a H porque 
C1V1 + C2V2 = C1V1 + C2V2 + 0V3 
Ahora sea x cualquier vector en H, por ejemplo, x = cıVı + c2V2 + c3v3. Puesto que 
v3 = 5v1 + 3v2, podemos sustituir 
X = C1V1 + C2V2 + c3 (5v1 + 3v2) 
= (c1 + 5c3)w1 + (c2 + 3c3)v2 
Así, x está en Gen (v;, v2), por lo que cada vector en H ya pertenece a Gen {v1, V2}. Llega- 
mos a la conclusión de que H y Gen [v;, vz) en realidad son el mismo conjunto de vectores. 


De lo que se deduce que (v;¡, vz) es una base de H, ya que {v;, v2} es, sin duda, linealmente 
independiente. E 


El siguiente teorema generaliza el ejemplo 7. 


El teorema del conjunto generador 
Sea S = {v1,..., Vp} un conjunto en V, y sea H = Gen {v1,..., Vp}. 


a) Si uno de los vectores de S, por ejemplo Vg, es una combinación lineal de los 
vectores restantes en S, entonces el conjunto formado a partir de S al eliminar vz 
aún genera a H. 


b) Si H + (0), algún subconjunto de S$ es una base para H. 


DEMOSTRACIÓN 


a) Al reordenar la lista de vectores en S, si es necesario, podemos suponer que V, es una 
combinación lineal de v;,..., v,-1, por ejemplo, 


Vp = 01V1 +=** + Ap-1Vp-1 (3) 


Dada cualquier x en H, podemos escribir 


X =C1V1 +: +Cp-1Vp-1 + CpVp (4) 

para escalares adecuados C;,..., Cy. Sustituyendo la expresión para v, de la ecuación 

3) en (4), es fácil ver que x es una combinación lineal de v;y,..., v,-¡. Por lo tanto, 
1 p-1 


[v1,-.., Vp-1) genera a H, ya que x es un elemento arbitrario de H. 
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b) Siel conjunto generador original S es linealmente independiente, entonces ya es una base 
para H. De lo contrario, uno de los vectores de § depende de los demás y se puede elimi- 
nar, de acuerdo con el inciso a). Siempre y cuando haya dos o más vectores en el conjunto 
generado, podemos repetir el proceso hasta que el conjunto generador sea linealmente 
independiente y, por lo tanto, sea una base para H. Si el conjunto generador finalmente se 
reduce a un vector, ese vector será distinto de cero (y, por lo tanto, linealmente indepen- 
diente), ya que H + {0}. E 


Bases para Nul A y Col A 


Ya sabemos cómo encontrar los vectores que generan el espacio nulo de una matriz A. El 
análisis de la sección 4.2 indicó que nuestro método siempre produce un conjunto linealmente 
independiente cuando Nul A contiene vectores distintos de cero. Por lo tanto, en este caso, 
ese método produce una base para Nul A. 

Los dos ejemplos siguientes describen un sencillo algoritmo que permite encontrar una 
base para el espacio columna. 


EJEMPLO 8 Encuentre una base para Col B, donde 


-1 
B=[b, b ç > b5]= 


O O Om 
ocooz- 
oco-—ro 
oroo 


0 


SOLUCIÓN Cada columna que no es pivote de B es una combinación lineal de las columnas 
pivote. De hecho, b2 = 4b; y b4 = 2b; — b}. De acuerdo con el teorema del conjunto genera- 
dor, podemos descartar a bz y b4, y {b;, b3, b5} aún generará a Col B. Sea 


1 0 0 
0 1 0 

S=4brb3bs=4X [ol lol 

0 0 0 

Ya que bı 4 0 y ningún vector en $ es una combinación lineal de los vectores que lo preceden, 
S es linealmente independiente (teorema 4). Por lo tanto, S es una base de Col B. E 


¿Qué pasa con una matriz A que no está en forma escalonada reducida? Recuerde que 
toda relación de dependencia lineal entre las columnas de A se puede expresar en la forma 
Ax = 0, donde x es una columna de pesos. (Si algunas columnas no están implicadas en una 
relación de dependencia en particular, entonces sus pesos son iguales a cero). Cuando A se 
reduce por filas a una matriz B, las columnas de B con frecuencia son totalmente diferentes 
de las columnas de A. Sin embargo, las ecuaciones Ax = 0 y Bx = 0 tienen exactamente el 
mismo conjunto de soluciones. Si A = [a, :** a,] y B = [b, -*- b,], entonces las ecuacio- 
nes vectoriales 


Ma + o +xnaY=0 y xibi+-:-+x»b, =0 


también tienen el mismo conjunto de soluciones. Es decir, las columnas de A tienen exacta- 
mente la misma relación de dependencia lineal que las columnas de B. 


EJEMPLO 9 Es posible demostrar que la matriz 


1 4 0 2- 
a DS 
ala, llo a 
520. 2.8 8 


es equivalente por filas a la matriz B del ejemplo 8. Encuentre una base para Col A. 
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TEOREMA 6 


SOLUCIÓN En el ejemplo 8 vimos que 

b = 4b; y b; = 2b; — b; 
por lo que podemos esperar que 

a = 4a) y a4 = 2a; — a3 


¡Compruebe que este es el caso! Por lo tanto, podemos descartar a az y ay cuando seleccio- 
namos un conjunto generador mínimo de Col A. En efecto, (a, az, as) debe ser linealmente 
independiente porque cualquier relación de dependencia lineal entre ay, az, as implicaría una 
relación de dependencia lineal entre b,, b3, bs. Pero sabemos que ([b;, b3, b5]) es un conjunto 
linealmente independiente. Por lo tanto, (a, az, as) es una base para Col A. Las columnas que 
se han utilizado para esta base son las columnas pivote de A. E 


Los ejemplos 8 y 9 ilustran el siguiente hecho que resulta de utilidad. 


Las columnas pivote de una matriz A forman una base para Col A. 


DEMOSTRACIÓN La demostración general utiliza los argumentos analizados antes. Sea 
B la forma escalonada reducida de A. El conjunto de columnas pivote de B es linealmente 
independiente, pues ningún vector del conjunto es una combinación lineal de los vectores 
que le preceden. Puesto que A es equivalente por filas, también las columnas pivote de A son 
linealmente independientes, ya que cualquier relación de dependencia lineal entre las co- 
lumnas de A corresponde a una relación de dependencia lineal entre las columnas de B. Por 
esta misma razón, todas las columnas que no sean pivote de A son una combinación lineal 
de las columnas pivote de A. Así, las columnas de A que no son pivote se pueden descar- 
tar del conjunto generador de Col A, de acuerdo con el teorema del conjunto generador. 
Esto deja a las columnas pivote de A como base para Col A. E 


Advertencia: Las columnas pivote de un matriz A son evidentes cuando A se ha reducido 
solamente a la forma escalonada. Sin embargo, tenga cuidado al usar las columnas pivote de 
la misma A como la base de Col A. Las operaciones de fila pueden cambiar el espacio colum- 
na de una matriz. Las columnas de una forma escalonada B de A con frecuencia no están en 
el espacio columna de A. Por ejemplo, todas las columnas de la matriz B en el ejemplo 8 
tienen ceros en sus últimas entradas, por lo que no pueden generar el espacio columna de la 
matriz A en el ejemplo 9. 


Dos perspectivas de una base 


Cuando se usa el teorema del conjunto generador, la eliminación de los vectores de un con- 
junto generador se debe detener cuando el conjunto se convierte en linealmente independiente. 
Si se elimina un vector adicional, no será una combinación lineal de los vectores restantes 
y, por lo tanto, el conjunto más pequeño ya no generará a V. Así, una base es un conjunto 
generador que es lo más pequeño posible. 

Una base también es un conjunto linealmente independiente lo más grande posible. Si S 
es una base para V, y si S se amplía con un vector (por ejemplo, w) de V, entonces el nuevo 
conjunto no puede ser linealmente independiente, ya que S genera a V, y w es, por lo tanto, 
una combinación lineal de los elementos en S. 


EJEMPLO 10 Los siguientes tres conjuntos de R? muestran cómo se puede ampliar un 
conjunto linealmente independiente a una base y cómo esta ampliación adicional destruye la 
independencia lineal del conjunto. Además, un conjunto generador se puede reducir a una 
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base, pero una reducción adicional destruye la propiedad de generación. 


1 2 
01,/3 
0 0 


Linealmente independiente, 


pero no genera a R? 


1 2 4 1 2 4 7 
01,3|,[5 O 13 13 eS 
0 0 6 0 0 6 9 

Una base Genera a R?, pero es 

para R3 linealmente dependiente A 


PROBLEMAS DE PRÁCTICA 


1 
1. Sea vı = 
3 


una base para R?? 


1 


2. Sea vı = | —3 |, v2 = 


4 


—2 y Ya = 


—2 
7 |. Determine si {v1, V2} es una base para R3. ¿Es {v1, v2} 
—9 


6 2 —4 
2 |, v3 = | —2 |y v4 = | —8 |. Determine una base para 


-1 3 9 


el subespacio W generado por {V1, V2, V3, V4}. 


1 
3. Seavi=|0 
0 


syr = 


s 
y H = s |: sen Rẹ. Entonces cada vector en H es una 


0 


combinación lineal de vı y v2 porque 


S 1 0 
s|i=s|0|+s| 1 
0 0 0 


¿Es {v1, v2) una base para H? 


4.3 EJERCICIOS 


Determine si los conjuntos de los ejercicios 1 a 8 son bases para R3. 
De los conjuntos que no son bases, determine cuáles son linealmente 
independientes y cuáles generan a R3. Justifique sus respuestas. 


1 1 1 1 0 0 
Eo ol: BAL ye (A 
0 0 0 1 
1 3 = 2 2 -8 
3.1 011 1-1 Sl e 
43 —4 1 1 2 4 
3 3 0 0 1 -4 
Salles Fela e Ea 6 la 73 
0 0 0 5 -4 6 
2 6 1 0 2 0 
ao el Bol els Pal! 
0 5 3 -1 5 zj 


Encuentre las bases para los espacios nulos de las matrices en los 
ejercicios 9 y 10. Consulte los comentarios que siguen el ejemplo 3 
en la sección 4.2. 


1 0 -2 -2 1 1 -2 1 5 
9. | 0 1 1 4 10. | 0 1 0 -I -2 
Fask =7 3 0. 0-8 0 16 





11. Encuentre una base para el conjunto de vectores en R? en el 
plano x-— 3y + 2z =0. [Sugerencia: Piense en la ecuación como 
en un “sistema” de ecuaciones homogéneas]. 











12. Encuentre una base para el conjunto de vectores de R? en la 
recta y = —3x. 

En los ejercicios 13 y 14, suponga que A es equivalente por filas a B. 

Encuentre las bases de Nul A y Col A. 


=2 4 = =4 1 0o 6 5 
13. A= 2 —6 -3 1|B=|0 2 5 3 
Ego 87 ¿22 3 0. 0 0.0 
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14. 


Espacios vectoriales 


1 2 3 -4 d 
12.02. .8 
dia 2 4 -3 10 97” 
3 6 0 6 9 
t 2 0 2 5 
0.0. 3-6 3 
B= 0 0 0 0 -7 
0 0 0 0 0Ọ0 


En los ejercicios 15 a 18, determine una base para el espacio genera- 
do por los vectores v1,..., Vs dados. 


15. 


16. 


17. 


18. 


19. 


20. 


1] fo 2 2 3 
0 E A a -1 
-2 p| 2 P| -8 PI 10 f| —6 
3 la J H 9 


1 —2 3 5 
0 (0) —1 —3 — 
opr opr 1p 3p 
1 2 -1 —4 
2 4 —2 8 —8 
olaa 
[M] A Zils 0 |, 8 |, 0 
—6 —4 1 —3 0 
o] | | | É l 
—3 3 0 6 —6 
E a 5 Al 3 
IM| 6]|,| -9|,| -4|,| -14|,| 0 
0 0 0 0 -1 
(aJl LL) 
4 1 7 
Sea vı = | —3 |, v = 9 |, v3 = | 11 |, y también sea 
7 —2 6 


H = Gen (vi, va, v3). Es posible comprobar que 4v, + 
5v2 — 3v3 = 0. Utilice esta información para encontrar una 
base para H. Hay más de una respuesta. 


3 4 2 
Sea vı = e Yo = i y V3= E . Es posible 
—5 4 —14 


comprobar que 2v; — v2 — v3 = 0. Utilice esta información 
para encontrar una base para H = Gen {v1, V2, V3}. 


En los ejercicios 21 y 22, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


21. 


a) Un solo vector por sí mismo es linealmente dependiente. 
b) Si H = Gen {b;,..., bp}, entonces {b1,..., bp} es una base 
para H. 


c) Las columnas de una matriz invertible de n x n forman una 
base para R”. 


d) Una base es un conjunto generador que es tan grande como 
sea posible. 


e) En algunos casos, las relaciones de dependencia lineal entre 
las columnas de una matriz se pueden ver afectadas por al- 
gunas operaciones elementales de fila en la matriz. 


22. 


23. 


24. 


25. 


26. 


27. 


28. 


a) Un conjunto linealmente independiente en un subespacio H 
es una base para H. 


b) Si un conjunto finito S de vectores diferentes de cero genera 
un espacio vectorial V, entonces algún subconjunto de S es 
una base para V. 


c) Una base es un conjunto linealmente independiente que es lo 
más grande posible. 


d) El método estándar para la obtención de un conjunto gene- 
rador para Nul A, que se describe en la sección 4.2, a veces 
falla al producir una base para Nul A. 


e) Si B es una forma escalonada de una matriz A, entonces las 
columnas pivote de B forman una base para Col A. 


Suponga que Rt = Gen {v1,..., V4}. Explique por qué {v1,..., V4} 
es una base para R4. 


Sea B = {v1,..., Vn} un conjunto linealmente independiente 
en [R”. Explique por qué B debe ser una base para R”. 

1 0 0 
Sea vı = | 0 |, v2 = | 1 |, v3 =| 1 | y sea Hel conjunto 


1 1 0 


de vectores en R3 cuyas segunda y tercera entradas son iguales. 
Entonces, todo vector de A tiene una expansión única como una 
combinación lineal de v1, v2, V3, porque 


sS 1 0 0 
ti=s|0|+(-s) 1 |+s| 1 
1 1 0 


para cualquier s y t. ¿Es (vi, vaz, v3) una base para H? 
¿Por qué? 


En el espacio vectorial de todas las funciones de valores reales, 
encuentre una base para el subespacio generado por (sen t, sen 
2t, sen t cos t}. 


Sea V el espacio vectorial de funciones que describen la vibra- 
ción de un sistema masa-resorte. (Consulte el ejercicio 19 de la 
sección 4.1). Encuentre una base para V. 


(Circuito RLC) El circuito de la figura consiste en una resisten- 
cia (R, ohms), un inductor (L, henrys), un condensador (C, fa- 
rads), y una fuente de voltaje inicial. Sea b = R/(2L), y suponga 
que R, L y C se han seleccionado de manera que b también es 
igual a 1/ VLC. (Esto se hace, por ejemplo, cuando el circuito 
se utiliza en un voltímetro). Sea v(t) el voltaje (en volts) en el 
tiempo £, medido a través del condensador. Es posible demostrar 
que v está en el espacio nulo A de la transformación lineal que 
mapea v(t) en Lv” (+) + Rv'(t) + (1/C)u(c), y H se compone 
de todas las funciones de la forma v(r) = e(c, + cat). Encuen- 
tre una base para H. 


Fuente 
de voltaje Ç 


Los ejercicios 29 y 30 indican que cada base de R” debe contener 
exactamente n vectores. 


29. Sea S= {v1,..., Vg} un conjunto de k vectores en R”, con k < n. 
Utilice un teorema de la sección 1.4 para explicar por qué S no 
puede ser una base para R”. 


30. Sea S = (v1,..., vx) un conjunto de k vectores en R”, con 
k > n. Utilice un teorema del capítulo 1 para explicar por qué 
S no puede ser una base para R”. 


Los ejercicios 31 y 32 revelan una importante conexión entre la in- 
dependencia lineal y las transformaciones lineales, y le permiten 
practicar el uso de la definición de dependencia lineal. Sean V y W 
espacios vectoriales, sea T : V —> W una transformación lineal, y sea 
[v1,..., vp) un subconjunto de V. 


31. Demuestre que si {Vv1,..., Vp} es linealmente dependiente en 
V, entonces el conjunto de imágenes, (T(v1),.... T(v,)]) es li- 
nealmente dependiente en W. Este hecho demuestra que si una 
transformación lineal mapea un conjunto {v1,..., Vp} en un con- 
junto linealmente independiente [T(v1),..., T(vp)), entonces el 
conjunto original es linealmente independiente también (porque 
no puede ser linealmente dependiente). 


32. Suponga que T es una transformación uno a uno, de modo que 
la ecuación T(u) = T(v) siempre implica que u = v. Demuestre 
que si el conjunto de imágenes {T(v1),..., T(vp)} es linealmente 
dependiente, entonces (v;,..., vp) es linealmente dependiente. 
Este hecho demuestra que una transformación lineal uno a uno 
mapea un conjunto linealmente independiente sobre un conjun- 
to linealmente independiente (porque en este caso el conjunto 
de las imágenes no puede ser linealmente dependiente). 


33. Considere los polinomios pi() = 1 + 1? y px) = 1-2? 
¿Es [pi, p2) un conjunto linealmente independiente en [P3? 
¿Por qué? 


34. Considere los polinomios pi(1) = 1 + £, p(t) = 1 — £, y 
p3(1) = 2 (para toda £). Por inspección, escriba una relación de 
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dependencia lineal entre p;, p2 y p3. Después encuentre una 
base para Gen (p1, P», P3). 


35. Sea V un espacio vectorial que contiene un conjunto linealmen- 
te independiente (u;, u, uz, us). Explique cómo construir un 
conjunto de vectores {V1, V2, V3, V4} en V tal que {v1, V3} sea una 
base para Gen {V1, V2, V3, V4}. 


36. [M] Sea H = Gen {u;, u, w3} y K = Gen (vi, v2, v3}, 


donde 
1 0 3 
2 2 < 4 
u = ol W = Ela u; = IP 
—1 1 —4 
—2 2 —1 
—2 3 4 


nap A 2p 5V5 6 
JO dsf Lay 


Encuentre las bases para H, K y H + K. (Véase los ejercicios 33 y 34 
en la sección 4.1). 


37. [M] Demuestre que {ź, sen f, cos 2t, sen t cos t} es un con- 
junto linealmente independiente de funciones definidas en R. 
Comience suponiendo que 


Ci: t +c: sent +c: cos?2t + c4: sentcost=0 (5) 


La ecuación (5) debe ser válida para toda ż real, así que elija 
varios valores específicos de £ (es decir, £ = 0, .1, .2) hasta ob- 
tener un sistema de ecuaciones suficientes para determinar que 
todas las c; deben ser cero. 


38. [M] Demuestre que {1, cos t, cos?t,..., cost} es un conjunto 
linealmente independiente de funciones definidas en R. Utilice 
el método del ejercicio 37. (Este resultado se necesitará en el 


ejercicio 34 de la sección 4.5). 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. SeaA = [vı 


v2]. Las operaciones de fila muestran que 


le ==2 1 -2 
3 —9 0 0 


No todas las filas de A contienen una posición pivote. De manera que las columnas de A 
no generan a R3, de acuerdo con el teorema 4 de la sección 1.4. Por lo tanto, [v1, v2) no es 
una base para R°. Ya que v; y v2 no están en [R?, no pueden ser la base de [R?. Sin embargo, 
puesto que es evidente que v; y v2 son linealmente independientes, son una base para un 
subespacio de RÍ, a saber, Gen [v1, va). 


2. Construya una matriz cuyo espacio columna sea el espacio generado por {V1, V2, V3, V4}, 
y después reduzca por filas a A para encontrar sus columnas pivote. 


1.6 2 
A=|-3 2 -2 
4 -1 3 


-4 1 6 2 —4 1 6 =å 
-8 |~ lo 22 4-—20ļ|~ļ0 5 1 —=5 
9 0 -25 -5 25 0 0 0 
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Las dos primeras columnas de A son las columnas pivote y, por consiguiente, forman una 
base de Col A = W. Por lo tanto, {v1, V2} es una base para W. Observe que no se necesita 
la forma escalonada reducida de A para localizar las columnas pivote. 


3. Ni vı ni v2 están en H, por lo que (v;, v2) no puede ser una base para H. De hecho, 
[v1, v2]) es una base para el plano de todos los vectores de la forma (c1, c2, 0), pero H es 
solo una recta. 


4.4 | SISTEMAS DE COORDENADAS 


TEOREMA 7 


DEFINICIÓN 


Una razón importante para especificar una base B para un espacio vectorial V es imponer 
un “sistema de coordenadas” en V. En esta sección se mostrará que si B contiene n vectores, 
entonces el sistema de coordenadas hará que V actúe como R”. Si V es ya R” mismo, entonces 
B determinará un sistema de coordenadas que da una nueva perspectiva a V. 

La existencia de sistemas de coordenadas se basa en el siguiente resultado fundamental. 


Teorema de la representación única 


Sea B = {b;,..., bn} una base para un espacio vectorial V. Así, para cada x en V, existe 
un conjunto único de escalares c1,..., Cn tal que 


x = cibi + e + cbn (1) 


DEMOSTRACIÓN Puesto que B genera a V, existen escalares tales que la ecuación (1) es 
válida. Suponga que x también tiene la representación 


x = dibi +--+ dnrbn 
para escalares d1,..., dp. Así, al restar, se tiene 
0=x-—x= (c; — di)b¡ +--- + (Cn — dn)bn (2) 


Puesto que B es linealmente independiente, los pesos en la ecuación (2) deben ser cero. 
Es decir, cj = dj para 1 Sj Sn. E 


Suponga que 8 = {b;,..., b„} es una base para V y que x está en V. Las coordenadas 
de x respecto de la base B (o las B-coordenadas de x) son los pesos c1,..., Cn tales 
que x = cib; + + + c,b,,. 


Si c1,..., Cn son las -coordenadas de x, entonces el vector en R” 


es el vector de coordenadas de x (respecto de B), o el vector de B-coordenadas de x. 
El mapeo x t> | x ]¿ es el mapeo de coordenadas (determinado por %8).' 


1 El concepto de un mapeo de coordenadas supone que la base es un conjunto indexado cuyos vectores se listan 
en un orden fijo asignado con anterioridad. Esta propiedad hace que la definición de [ x ] yg no sea ambigua. 
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EJEMPLO 1 Considere una base B = {b;, b2} para [R?, donde b, = [ol y b2 = [>| 


: =2 y 
Supongamos que una x en R? tiene el vector de coordenadas [ x lg = | | Determine x. 


3 


SOLUCIÓN Las coordenadas BB de x nos dicen cómo construir x a partir de los vectores 
en B. Es decir, 


x= +3 = D| a+] =a n 


EJEMPLO 2 Las entradas en el vector x = B son las coordenadas de x respecto de 


la base estándar € = {e;, e2}, ya que 


a [es [0] =10e +. 


RS [x]; =x. a 


Una interpretación gráfica de coordenadas 


Un sistema de coordenadas en un conjunto se compone de un mapeo uno a uno de los pun- 
tos en el conjunto dentro de R”. Por ejemplo, el papel común para gráficas proporciona un 
sistema de coordenadas del plano cuando se seleccionan ejes perpendiculares y una unidad 
de medida en cada eje. La figura 1 muestra la base estándar fe, e>), los vectores b¡ (= ej) y 


b, del ejemplo 1, y del vector x = Lal Las coordenadas 1 y 6 dan la ubicación de x 


respecto de la base estándar: 1 unidad en la dirección e; y 6 unidades en la dirección e). 

La figura 2 muestra los vectores by, b2 y x de la figura 1. (Desde el punto de vista geo- 
métrico, los tres vectores se encuentran en una recta vertical en ambas figuras). Sin embar- 
go, el sistema de coordenadas estándar se borró y se remplazó por una malla especialmente 


adaptada a la base B del ejemplo 1. El vector de coordenadas [ x ] B= | Al da la ubicación 


de x en este nuevo sistema de coordenadas: —2 unidades en la dirección b, y 3 unidades en 
la dirección b». 
















































































b; 
e 
0 b =e 
FIGURA 1 FIGURA 2 
Papel cuadriculado estándar. Papel para gráficas B. 


EJEMPLO 3 En cristalografía, la descripción de una red cristalina se mejora eligiendo 
una base (u, v, w) para R? que corresponda a tres aristas adyacentes de una “celda unitaria” 
del cristal. Se construye una red entera apilando muchas copias de una sola celda. Hay 14 
tipos básicos de celdas unitarias; en la figura 3, se muestran tres.? 


2 Adaptado de The Science and Engineering of Materials, 4a. edición, por Donald R. Askeland (Boston: Prindle, 
Weber £ Schmidt O 2002), p. 36. 
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b, T b; 
a 





FIGURA 4 El vector de 
coordenadas BB de x es (3, 2). 


w 
<T 
LW D 
w, 
~a —L 
n E > 03 
` v 
u LA y u EN u AA 
a b) Cc 
Monoclínica Cúbica centrada Ortorrómbica centrada 
simple en el cuerpo en la cara 


FIGURA 3 Ejemplos de celdas unitarias. 


Las coordenadas de los átomos dentro del cristal están dadas respecto de la base de la 
red. Por ejemplo, 


1/2 
1/2 
1 


identifica el átomo centrado en la cara superior de la celda en la figura 3 c). E 


Coordenadas en R” 


Cuando una base B para R” está fija, el vector de coordenadas B de una x dada es fácil de 
determinar, como se muestra en el siguiente ejemplo. 


EJEMPLO 4 Sean b; = [5] 03 = [7] == B y B = {b;, b2}. Determine el 


vector de coordenadas [ x ] g de x respecto de B. 


SOLUCIÓN Las coordenadas B de c1, c2 de x satisfacen 


Ra 


bı b2 X 


2 —1 caf |4 
AR © 
bi b x 


Esta ecuación se puede resolver mediante operaciones de fila en una matriz aumentada 
o utilizando la inversa de la matriz a la izquierda. En cualquier caso, la solución es cı = 3, 
c2 = 2. Por lo tanto, x = 3b, + 2b, y 


o =[2]-[3] 


La matriz en la ecuación (3) cambia las coordenadas 5 de un vector x en las coordenadas 
estándar para x. Es posible realizar un cambio análogo de coordenadas en R” para una base 
B = {b;,..., bn}. Sea 


Véase la figura 4. 


Pg= {b} b =: b,} 


TEOREMA 8 
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Entonces la ecuación vectorial 
x = c1bı + c2b2 + -++ + Cnbn 
es equivalente a 


x =Pblx]g (4) 


Se llama Pg a la matriz de cambio de coordenadas de £B a la base estándar en R”. Multi- 
plicando por la izquierda a Pg se transforma al vector de coordenadas [ x ] g €n x. La ecua- 
ción de cambio de coordenadas (4) es importante y será necesaria en varias secciones de 
los capítulos 5 y 7. 

Puesto que las columnas de Pg forman una base para R”, Pg es invertible (por el teo- 
rema de la matriz invertible). Al multiplicar por la izquierda por Pg l se convierte a x en 
su vector de coordenadas $: 


Pg x= [Xx], 


La correspondencia x > [x]z, producida aquí por Pz”, es el mapeo de coordenadas men- 
cionado anteriormente. Ya que Pg l es una matriz invertible, el mapeo de coordenadas es 
una transformación lineal uno a uno de R” en R”, de acuerdo con el teorema de la matriz 
invertible. (Véase también el teorema 12 de la sección 1.9). Esta propiedad del mapeo de 
coordenadas también es cierto en un espacio vectorial general que tiene una base, como se 
verá más adelante. 


El mapeo de coordenadas 


La elección de una base 6 = {b;,..., b„} de un espacio vectorial V introduce un sistema de 
coordenadas en V. El mapeo de coordenadas x > [x] g Conecta al espacio V, posiblemente 
desconocido, con el conocido espacio R”. Véase la figura 5. Los puntos de V ahora se pueden 
identificar por sus nuevos “nombres”. 


[lg 
x° e xl 
| 


l 
pe a 
yv R 


FIGURA 5 El mapeo de coordenadas de V sobre R”. 


Sea 5 = {b;,..., bn} una base para un espacio vectorial V. Así, el mapeo de coordenadas 
x > [x ], es una transformación lineal uno a uno de V en R”. 


DEMOSTRACIÓN Tome dos vectores típicos en V, por ejemplo, 


u =C¡b; +---+C;b,, 
w= d¡b; +---+d;b, 


Luego, utilizando las operaciones de vectores, 


u +w = (c1 + di)bi +--+ + (Cn + dn)bn 
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De ello se sigue que 
c1+d; C1 dı 
a A A E a Mer 
Cn + An Cn dn 


Por lo tanto, el mapeo de coordenadas conserva la adición. Si r es un escalar cualquiera, 
entonces 


ru = r (cibi +-+: + cnbn) = (rci)bi +--+ + (rcn)bn 
De esta forma, 


rci C1 
[ru]; = : =f : =r[u], 


FCn Cn 


Así, el mapeo de coordenadas también conserva la multiplicación escalar, y por consiguiente, 
es una transformación lineal. Véase los ejercicios 23 y 24 para comprobar que el mapeo de 
coordenadas es uno a uno y mapea V sobre R”. E 


La linealidad del mapeo de coordenadas se extiende a las combinaciones lineales, al igual 
que en la sección 1.8. Si u;,..., u, están en V y si c1,..., Cp son escalares, entonces 


[cm +++ +70) ], = cilu lg ++ clup lg (5) 


Es decir, (5) nos dice que el vector de B-coordenadas de una combinación lineal de u;,..., U, 
es la misma combinación lineal de sus vectores de coordenadas. 

El mapeo de coordenadas en el teorema 8 es un importante ejemplo de un isomorfismo 
de V en R”. En general, una transformación lineal uno a uno de un espacio vectorial V en 
un espacio vectorial W se llama isomorfismo de V en W (el término proviene de los voca- 
blos griegos iso, que significa “lo mismo”, y morfé, que significa “forma” o “estructura”). 
La notación y la terminología para V y W pueden diferir, pero los dos espacios son indistin- 
guibles como espacios vectoriales. Cada cálculo de espacio vectorial en V se reproduce con 
exactitud en W, y viceversa. En particular, cualquier espacio vectorial real con una base de 
n vectores es indistinguible de R”. Véase los ejercicios 25 y 26. 


EJEMPLO 5 Sea B la base estándar del espacio P} de polinomios; es decir, sea 
B = {1, t, t?, t°}. Un elemento típico p de Py tiene la forma 


p(t) = ao + aıt + azt? + azt? 


Puesto que p ya se ha desplegado como una combinación lineal de los vectores básicos es- 
tándar, concluimos que 


ao 
a1 
a2 
a3 


[P]; = 


Así, el mapeo de coordenadas p + [p ],¿ es un isomorfismo de P; sobre R4. Todas las opera- 
ciones de espacio vectorial en Pz corresponden a operaciones en R4. E 


Si pensamos en P} y R4 como despliegues en dos pantallas de computadora que se 
conectan a través del mapeo de coordenadas, entonces cada operación de espacio vectorial 
en P, en una pantalla es duplicada exactamente por una operación vectorial correspondien- 
te en R* en la otra pantalla. Los vectores en la pantalla Pz tienen un aspecto diferente res- 
pecto de los que aparecen en la pantalla de R*, pero “actúan” como vectores exactamente de 
la misma forma. Véase la figura 6. 


4.4 Sistemas de coordenadas 221 





FIGURA 6 El espacio Pz es isomorfo a R4. 


EJEMPLO 6 Utilice vectores de coordenadas para comprobar que los polinomios 1 + 22?, 
d+ r+5e, y 3 + 2£ son linealmente dependientes en P3. 


SOLUCIÓN El mapeo de coordenadas del ejemplo 5 produce los vectores de coordenadas 
(1, 0, 2), (4, 1, 5) y (3, 2, 0), respectivamente. Al representar estos vectores como las columnas 
de una matriz A, podemos determinar su independencia mediante reducción por filas de la 
matriz aumentada de Ax = 0: 


1 4 3 0 1 3 0 
0O 1 2 0O[=j0 1 2 Ọ 
2 5 0 0 0 0.0 


Las columnas de A son linealmente dependientes, por lo que los polinomios correspondien- 
tes son linealmente dependientes. De hecho, es fácil comprobar que la columna 3 de A es la 
columna 2 multiplicada por 2, menos la columna 1 multiplicada por 5. La relación correspon- 
diente de los polinomios es 

3+21 =2(4 +1 +51?) — 5(1 + 21?) E 


El último ejemplo se refiere a un plano en R* que es isomorfo a R?. 


EJEMPLO 7 Sea 


3 —1 3 
v=]|6l|, v= 0| x=]|121 
2 1 7 


y B = {v;, v2}. Entonces B es una base para H = Gen ([v;, v2). Determine si x se encuentra 
en H y, si lo está, encuentre el vector de coordenadas de x respecto de B. 


SOLUCIÓN Si x está en H, entonces la siguiente ecuación vectorial es consistente: 


3 —1 3 
cil 6|+<c 0|=|12 
2 1 T 


Los escalares cı y c2, si existen, son las coordenadas BB de x. Usando operaciones de fila, se 
obtiene 
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Así, (1 =2,c2=3 y[x lg = ø El sistema de coordenadas en A determinadas por B 


se muestra en la figura 7. E 





FIGURA 7 Un sistema de coordenadas en un 
plano H en RÌ. 


Si se eligiera una base diferente para H, ¿el sistema de coordenadas asociado tam- 
bién haría a H isomorfo a R?? Sin duda, esto debe ser verdad. Así lo demostraremos en la 
siguiente sección. 


PROBLEMAS DE PRÁCTICA 


1 —3 3 —8 
1. Sea b; = | 0 |, b2 = 4 |, b3 = | —6 |y x= 2 
0 0 3 3 


a) Demuestre que el conjunto 5 = {b;, b2, b3} es una base de R3. 
b) Encuentre la matriz de cambio de las coordenadas de B a la base estándar. 
c) Escriba la ecuación que relaciona x en R? con [x] pi 


d) Encuentre [x ],¿, para la x dada anteriormente. 


2. El conjunto B = {1 + t, 1 + 1?, 1 + 1?) es una base para [P,. Encuentre el vector de coor- 
denadas de p(1) = 6 + 3t — 1? en relación con B. 


4.4 EJERCICIOS 


En los ejercicios 1 a 4, encuentre el vector x determinado por el vec- En los ejercicios 5 a 8, encuentre el vector de coordenadas [x ] 6 
tor de coordenadas [ x ],, y la base B. de x respecto de la base B = (b,, ..., b,,). 


e [3] [iaa [5] + m-[2)9-[3)=[7] 
pes] eR 


Hea iE 
a | 


2. B 


el 
o 
II 
A a ~ 
l 
WN 


En los ejercicios 9 y 10, encuentre la matriz de cambio de coordena- 
das de B a la base estándar en R”. 


er 


3 2 1 
10. B= 01, 2 ls] =2 
6 —4 3 


En los ejercicios 11 y 12, utilice una matriz inversa para encontrar 
[x]; para x y B. 


Pl 
es) 


13. El conjunto B = (1 + P,1 +4, 1 +21 +?) es una base 
para [PP,. Encuentre el vector de coordenadas de p(1) = 1 + 
4t + TP respecto de B. 


14. El conjunto B = {1 — £, t — t, 2 — t + f°} es una base para 
P,. Encuentre el vector de coordenadas de p(t) = 1 + 31 — 61? 
respecto de B. 


En los ejercicios 15 y 16, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. A menos que se indique lo con- 
trario, $ es una base para un espacio vectorial V. 


15. a) Si x está en V y si B contiene n vectores, entonces el vector 
de coordenadas B de x está en R”. 


b) Si Pg es la matriz del cambio de coordenadas, entonces 
[x], = Pgx, para x en V. 


c) Los espacios vectoriales [Pz y RÍ son isomorfos. 


16. a) Si B es la base estándar para [R”, entonces el vector de coor- 
denadas BB de una x en R” es x misma. 


b) La correspondencia [ x ] g > X se llama el mapeo de coorde- 
nadas. 


c) En algunos casos, un plano en R3 puede ser isomorfo a R?. 


17. Los vectores vı = mE = H = (5 generan 


a R?, pero no forman una base. Encuentre formas diferentes de 


1 A A 
expresar | 1 como una combinación lineal de v1, V2, V3. 


18. Sea B = {b;,..., b„} una base para un espacio vectorial V. 
Explique por qué los vectores de coordenadas B de bj,..., b,, 
son las columnas e;,..., €, de la matriz identidad de n x n. 


19. Sea S un conjunto finito en un espacio vectorial V con la pro- 
piedad de que cada x en V tiene una representación única como 
una combinación lineal de elementos de S. Demuestre que S 
es una base de V. 


20. Suponga que ([v;,..., va) es un conjunto linealmente dependiente 
que genera un espacio vectorial V. Demuestre que cada w en V 
se puede expresar en más de una forma como una combinación 
lineal de v;,..., Va. [Sugerencia: Considere w = kiv; + = + 
kava un vector arbitrario en V. Utilice la dependencia lineal de 
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[v1,..., v4) para obtener otra representación de w como una 
combinación lineal de v;,..., va]. 


1 


21. Sea B = la 


| E | ) Puesto que el mapeo de coordena- 


das determinado por B es una transformación lineal de R? 
en R?, este mapeo se debe implementar mediante alguna ma- 
triz A de 2 x 2. Encuéntrela. [Sugerencia: La multiplicación 
por A debería transformar un vector x en su vector de coorde- 


nadas [ x ]¿1. 


22. SeaB = (b;,..., b,) una base para [R”. Obtenga una descripción 
de una matriz A de n x n que implemente el mapeo de coorde- 
nadas x > [x ],. (Véase el ejercicio 21). 


Los ejercicios 23 a 26 se refieren a un espacio vectorial V, una base 
B = (bi,..., b,), y el mapeo de coordenadas x > [x], 


23. Demuestre que el mapeo de coordenadas es uno a uno. 
(Sugerencia: Suponga que [u]; = [w], para algunas u y w 
en V, y demuestre que u = w). 


24. Demuestre que el mapeo de coordenadas es sobre R”. Es decir, 
dada cualquier y en R”, con entradas y1,..., Yn, Obtenga u en V 
tal que [u]; = y. 


25. Demuestre que un subconjunto {u;,..., up} en V es linealmente 
independiente si y solo si el conjunto de vectores de coordena- 
das ([u1 ];,..., [up ],) es linealmente independiente en R”. 
(Sugerencia: Como el mapeo de coordenadas es uno a uno, las 
siguientes ecuaciones tienen las mismas soluciones, Cy,..., Cp). 


El vector cero en V 
El vector cero en R” 


ciu + ++ + cpu) =0 
[cu + ++ + CpUp] yz = [0], 
26. Dados los vectores u;,..., Up, y wW en V, demuestre que w es 


una combinación lineal de u;,..., u, si y solo si [w], es una 
combinación lineal de los vectores de coordenadas 


[u lio +++» TU lg 


En los ejercicios 27 a 30, utilice los vectores de coordenadas para 
probar la independencia lineal de los conjuntos de polinomios. 
Explique su trabajo. 


27. 14218, 24+1-38%, 142121? 
28. 1—2 -— t’, t +28, 141-218? 
29. (1-19, 1-27 +%, (1-1) 

30. (2-1, (3-1?, 1+6t - 512 + 1% 


31. Utilice los vectores de coordenadas para comprobar si los si- 
guientes conjuntos de polinomios generan a [P». Justifique sus 
conclusiones. 


a) 1— 3t + 5t?, —3 + 5t - 74%, -4+ 5t -61?, 1-1? 
b) 5t + t?, 1 — 8t — 2t?, —3 + 4t + 2t, 2 — 3t 





32. Sea p(t) = 1 + £, p(t) = t — 3t, pt) = 1 +t- 3t. 
a) Utilice vectores de coordenadas para demostrar que estos 
polinomios forman una base para P3. 
b) Considere de la base B = (pi, p», p3) para P2. Encuentre 
=1 
q en P», considerando que [q], = 1 
2 
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En los ejercicios 33 y 34, determine si el conjunto de polinomios 
forman una base para P}. Justifique sus conclusiones. 


33. [M] 3 + 7t,5 + t —2t?,t —2t°,1 + 16t — 6t? + 21% 


34. [M] 5 — 3t + 4t? + 2t?,9 +t + 8P -— 6t, 6— 2t + 5t, t? 
35. [M] Sea H = Gen (vi, va) y B = {v1, V2}. Demuestre que x 
está en A y encuentre el vector de coordenadas B de x, para 
11 14 19 
=5 —8 —-13 


A e a A 
7 10 15 


[M] Sea H = Gen {v1, v2, v3} y B = {v1, V2, V3}. Demuestre 
que 5 es una base para H y que x está en H, y encuentre el vec- 
tor de coordenadas $ de x, para 


36. 


—6 8 —9 4 

v= 1 2 = pi ,V3= > X= E 
—9 7 —8 —8 

4 —3 3 3 


[M] Los ejercicios 37 y 38 se refieren a la red cristalina del tita- 
nio, que tiene la estructura hexagonal que se ilustra a la izquierda 


2.6 0 0 
en la figura adjunta. Los vectores | —1.5 |,| 3 |,| 0 [en R* 
0 0 4.8 


forman una base para la celda unitaria de la derecha. Los números 
están en unidades angstrom (1 Á = 1078 cm). En las aleaciones de 


titanio, algunos átomos adicionales pueden estar en la celda unitaria 
en los sitios octaédricos y tetraédricos (llamados así por los objetos 
geométricos que forman los átomos en estos lugares). 


EA SS, x 
DS L4 Ez pS 





© 7 
y Y 


La red compacta hexagonal y su celda unitaria. 


1/2 

1/4 |, respecto de la base 
1/6 

de la red. Determine las coordenadas de este sitio en relación 
con la base estándar de R3, 


37. Uno de los sitios octaédricos es 


1/2 
1/2 |. Determine las coor- 
1/3 


denadas de este sitio en relación con la base estándar de R?. 


38. 


Uno de los sitios tetraédricos es 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. a) Es evidente que la matriz Pg = [b; 


b> b3] es equivalente por filas a la matriz 


de identidad. Por el teorema de la matriz invertible, Pg es invertible y sus columnas 
forman una base de R?. 


1-3 3 
b) Del inciso a), la matriz de cambio de coordenadas es Pg = | 0 4 -6 
0 0 3 


c) x= Pg[ x]; 


d) Para resolver la ecuación en c), es probable que sea más fácil de reducir por filas una 
matriz aumentada que calcular Pg L; 


1 
0 
0 


De ahí que 


—3 3 -8 1 0 0—5 
4 6 2|-=|0 1 0 2 
0. 3 3 0. 0 1. 1 

Pg X I [lx], 

=5 
[xs]=| 2 
1 


2. Las coordenadas de p(t) = 6 + 31 — t? respecto de B satisfacen 


all +A +alle HHS t? 


4.5 La dimensión de un espacio vectorial 225 


Al igualar los coeficientes de potencias de t, se tiene que 


C1 +C 
C1 + (3= 
C2 + c3 = —1 
Al resolver, se encuentra que c1 = 5, c2 = 1, c3 = —2 y [p la = 1 


4.5 | LA DIMENSIÓN DE UN ESPACIO VECTORIAL 


TEOREMA 9 


El teorema 8 de la sección 4.4 implica que un espacio vectorial V con una base B que con- 
tiene n vectores es isomorfo a R”. En esta sección veremos que este número n es una propie- 
dad intrínseca (llamada dimensión) del espacio V que no depende de la elección particular 
de la base. El análisis de la dimensión le ayudará a comprender mejor las propiedades de las 
bases. 

El primer teorema generaliza un resultado bien conocido acerca del espacio vectorial R”. 


Si un espacio vectorial V tiene una base B = {b1,..., bn}, entonces cualquier conjunto 
en V que contenga más de n vectores debe ser linealmente dependiente. 


DEMOSTRACIÓN Sea (u,,..., u,) un conjunto de V con más de n vectores. Los vectores de 
coordenadas [u; ]¿,..., [uy ]¿ forman un conjunto linealmente dependiente en R”, porque 
hay más vectores (p) que entradas (n) en cada vector. Por lo tanto, existen escalares Cj,..., Cp, 
no todos cero, tales que 


cilu ]g +- +cplu]g = | : El vector cero en R” 
0 


Como el mapeo de coordenadas es una transformación lineal, 


0 
[cu + + cpu |, = 


El vector cero de la derecha muestra los n pesos necesarios para construir el vector 


cuy + ++ + cpu, de los vectores básicos en B. Es decir, cyu) + ©: + cpp 
0- bi + +0- b, = 0. Puesto que no todas las c; son cero, (u;,..., u,) es linealmente 
dependiente. ! E 


El teorema 9 implica que si un espacio vectorial V tiene una base B = (bj,..., b,), en- 
tonces cada conjunto linealmente independiente ubicado en V no tiene más de n vectores. 


1 El teorema 9 también se aplica a los conjuntos infinitos en V. Se dice que un conjunto infinito es linealmente 
dependiente si algún subconjunto finito es linealmente dependiente; de lo contrario, el conjunto es linealmente inde- 
pendiente. Si $ es un conjunto infinito de V, tome cualquier subconjunto (uy,..., uy) de S, con p>n. La demostración 
anterior indica que este subconjunto es linealmente dependiente y, por lo tanto, también lo es S. 
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TEOREMA 10 


DEFINICIÓN 





Si un espacio vectorial V tiene una base de n vectores, entonces toda base de V debe 
consistir exactamente en n vectores. 


DEMOSTRACIÓN Sea B; una base de n vectores y B, cualquier otra base (de V). Ya que 
B; es una base y Bes linealmente independiente, B2 no tiene más de n vectores, de acuerdo 
con el teorema 9. Además, puesto que 52 es una base y B; es linealmente independiente, 
B3 tiene al menos n vectores. Así, B2 se compone de exactamente n vectores. E 


Si un espacio vectorial V distinto de cero es generado por un conjunto finito S, entonces 
un subconjunto de S es una base para V, de acuerdo con el teorema del conjunto generador. 
En este caso, el teorema 10 asegura que la siguiente definición tiene sentido. 


Si V es generado por un conjunto finito, entonces se dice que V tiene dimensión finita, 
y la dimensión de V, representada como dim V, es el número de vectores en una base 
para V. La dimensión del espacio vectorial cero (0) se define como cero. Si V no es 
generado por un conjunto finito, entonces se dice que V tiene dimensión infinita. 


EJEMPLO 1 La base estándar para R” contiene n vectores, por lo que dim R” = n. 
La base polinomial estándar {1, t, e} indica que dim P2= 3. En general, dim P, = n + 1. 
El espacio P de todos los polinomios es de dimensión infinita (ejercicio 27). E 


3 —-1 
EJEMPLO 2 Sea H = Gen {v;, v2}, donde vı = | 6 | y v2 = 0 |. Entonces H es 
2 1 


el plano estudiado en el ejemplo 7 de la sección 4.4. Una base para H es (v1, v2), ya que 
vı y V2 no son múltiplos y, por consiguiente, son linealmente independientes. Por lo tanto, 
dim H = 2. E 


EJEMPLO 3 Encuentre la dimensión del subespacio 


a—3b + 6c 
H = o :a,b,c,denR 
5d 


SOLUCIÓN Es fácil ver que H es el conjunto de todas las combinaciones lineales de los 
vectores 


1 =3 6 0 

vy= 3 > MW 2 > v3= 9 , Va = a 
0 1 =2 -1 
0 0 0 


Claramente, v; + 0, v, no es un múltiplo de v;, pero vz es un múltiplo de v,. De acuerdo con 
el teorema del conjunto generador, podemos descartar a v3 y aún así tener un conjunto gene- 
rador H. Finalmente, v4 no es una combinación lineal de v, y v,. Por lo tanto, {V1, V2, V4} es 
linealmente independiente (de acuerdo con el teorema 4 de la sección 4.3) y, en consecuencia, 
es una base para H. Por consiguiente, dim H = 3. E 


EJEMPLO 4 Los subespacios de R? se pueden clasificar por dimensiones. Véase la figura 1. 


Subespacios de dimensión 0. Solo el subespacio cero. 


Subespacios de dimensión 1. Cualquier subespacio generado por un solo vector distinto 
de cero. Tales subespacios son rectas que pasan por el origen. 


TEOREMA 11 


TEOREMA 12 
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Subespacios de dimensión 2. Cualquier subespacio generado por dos vectores lineal- 
mente independientes. Tales subespacios son planos que pasan por el origen. 


Subespacios de dimensión 3. Solo el propio R?. Cualesquiera tres vectores linealmen- 
te independientes en R3 generan todo R3, de acuerdo con el teorema de la matriz 
invertible. E 


0-dim — 


= 





a) 
FIGURA 1 Subespacios muestra de RR, 


Subespacios de un espacio de dimensión finita 


El siguiente teorema es una contraparte natural del teorema del conjunto generador. 


Sea H un subespacio de un espacio vectorial de dimensión finita V. Cualquier con- 
junto linealmente independiente en H se puede expandir, si es necesario, a una base 
de H. Además, H tiene dimensión finita y 


dim A < dim V 


DEMOSTRACIÓN SiH = {0}, entonces, sin duda, dim H = 0 = dim V. De lo contrario, sea 
S = {u;,..., Uz} cualquier conjunto linealmente independiente en H. Si S genera a H, enton- 
ces S es una base para H. De lo contrario, existe algún uz+ı en H que no está en el generado 
por S. Pero entonces (u;,..., Uz, Uz+1) será linealmente independiente, ya que ningún vector 
en el conjunto puede ser una combinación lineal de los vectores que le preceden (de acuerdo 
con el teorema 4). 

En tanto que el nuevo conjunto no genere a H, podemos continuar con este proceso 
de expansión de S a un conjunto más amplio linealmente independiente en H. Sin embargo, 
el número de vectores en una expansión linealmente independiente de S nunca podrá superar 
la dimensión de V, de acuerdo con el teorema 9. Así, finalmente la expansión de $ generará 
a H y, por lo tanto, será una base para H, y dim H < dim V. m 


Cuando se conoce la dimensión de un espacio o subespacio vectorial, la búsqueda de 
una base se simplifica con el siguiente teorema, el cual dice que si un conjunto tiene el nú- 
mero correcto de elementos, entonces solo se tiene que demostrar ya sea que el conjunto 
es linealmente independiente o que este genera el espacio. El teorema es de importancia 
fundamental en muchos problemas de aplicación (por ejemplo, los que implican ecuaciones 
diferenciales o ecuaciones en diferencias), donde la independencia lineal es mucho más fácil 
de comprobar que la generación. 


El teorema base 


Sea V un espacio vectorial de dimensión p, donde p = 1. Cualquier conjunto lineal- 
mente independiente de exactamente p elementos en V es, de forma automática, una 
base para V. Cualquier conjunto de exactamente p elementos que genera a V es, de 
manera automática, una base para V. 
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DEMOSTRACIÓN De acuerdo con el teorema 11, un conjunto linealmente independiente 
S de p elementos se puede ampliar a una base para V. Sin embargo, esa base debe conte- 
ner exactamente p elementos, ya que dim V = p. Así que S debe ser ya una base para V. 
Ahora suponga que S tiene p elementos y genera a V. Puesto que V es diferente de cero, el 
teorema del conjunto generador implica que un subconjunto S’ de S es una base de V. Como 
dim V = p, S' debe contener p vectores. Por lo tanto, $ = S’. E 


Las dimensiones de Nul A y Col A 


Como las columnas pivote de una matriz A forman una base para Col A, conocemos la di- 
mensión de Col A tan pronto como se conocen las columnas pivote. Tal vez parezca que la 
dimensión de Nul A requiere de más trabajo, ya que encontrar una base para Nul A, por lo 
general, toma más tiempo que una base para Col A. Pero, ¡hay un atajo! 

Sea A una matriz de m x n, y supongamos que la ecuación Ax = 0 tiene k variables li- 
bres. De la sección 4.2, sabemos que el método estándar para encontrar un conjunto genera- 
dor para Nul A producirá exactamente k vectores linealmente independientes, por ejemplo, 
U;,..., U¿, UNO para cada variable libre. Por lo tanto, (u;,..., uz) es una base para Nul A, y el 
número de variables libres determina el tamaño de la base. Hagamos un resumen de estos 
hechos para referencia futura. 


La dimensión de Nul A es el número de variables libres en la ecuación Ax = 0, y la 
dimensión de Col A es el número de columnas pivote de A. 


EJEMPLO 5 Determine las dimensiones del espacio nulo y el espacio columna de 


316 =i di 
As Pel: Y Zuel 
Zs 5 g A 


SOLUCIÓN Reduzca por filas la matriz aumentada [A 0] a la forma escalonada: 


2. 2. .3-1 0 
0. 12-22 0 
0.0. 0 0.0 


oo 


Hay tres variables libres: x>, x4 y xs. Por consiguiente, la dimensión de Nul A es 3. Por otra 
parte, dim Col A = 2 porque A tiene dos columnas pivote. E 


PROBLEMAS DE PRÁCTICA 


Determine si cada enunciado es verdadero o falso, y dé una razón para cada respuesta. Aquí, 

V es un espacio vectorial de dimensión finita diferente de cero. 

1. Sidim V = p, y si S es un subconjunto linealmente dependiente de V, entonces S con- 
tiene más que p vectores. 

2. SiS genera a V y si T es un subconjunto de V que contiene más vectores que S, entonces 
T es linealmente dependiente. 


4.5 EJERCICIOS 


Para cada subespacio en los ejercicios 1 a 8, a) encuentre una base 
para el subespacio, y b) indique la dimensión. 





s—2f 2a 
1. s+t |:s,ten R 2. —4b |:a,benR 
3t —2a 
2c p+2q 
a=b | =P : 
3. b- 3c :a,b,cen Rọ 4. iag :p,qenR 
a+2b p+q 
p=2q 
2p+5r |. 
5. -2q + 2r :p,q, ren R 
—3p + 6r 
3a— c 
—b — 3c 
6. Ta + 6b + 5c :a,b,cen R 
—3a +c 
7. {(a,b,c):a— 3b +c = 0,b — 2c = 0,2b — c = 0} 


8. {(a,b,c,d):a— 3b +c = 0} 


9. Encuentre la dimensión del subespacio de todos los vectores en 
R? cuyas entradas primera y tercera sean iguales. 


10. Encuentre la dimensión del subespacio H de R? generado por 
1 -2 =3 
—5 f| 10 f| 15 
En los ejercicios 11 y 12, encuentre la dimensión del subespacio ge- 
nerado por los vectores dados. 


1 3 —2 5 
1. |0|,|1|,|-11,/2 
2 1 1 2 
1 —3 =2 —3 
12. | -2 |,| —6 |. 3 la 5 
0 0 5 5 


Determine las dimensiones de Nul A y Col A de las matrices que se 
muestran en los ejercicios 13 a 18. 


i —6 9 0 3] 
0 1 2 -4 5 
3. A= o o 5 1 
0o 0 0 0 0 
—4 —2 6 0 


oO ooN 
ooo 
OOn-— uu 

_ 

E 

l 

N 


— 
N 
W 
o 
o 


15. A= 


| 
| 
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1 -1 0 1 1 —1 
17. A=|0 1 3 18 4A=|0 2 0 
0 0 1 o 0 0 


En los ejercicios 19 y 20, V es un espacio vectorial. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 


19. a) El número de columnas pivote de una matriz es igual a la 
dimensión de su espacio columna. 


b) Un plano en R? es un subespacio de dimensión 2 de R?. 
c) La dimensión del espacio vectorial P4 es 4. 


d) Si dim V = n y S es un conjunto linealmente independiente 
en V, entonces S es una base para V. 


e) Si un conjunto (vy,..., V)) genera un espacio vectorial V de 
dimensión finita y si T es un conjunto de más de p vectores 
en V, entonces T es linealmente dependiente. 


20. a) R? es un subespacio de dimensión 2 de R?. 


b) El número de variables en la ecuación Ax = 0 es igual a la 
dimensión de Nul A. 


c) Un espacio vectorial es de dimensión infinita si es generado 
por un conjunto infinito. 


d) Si dim V = n, y si S genera a V, entonces $ es una base 
de V. 


e) El único subespacio de dimensión 3 de R? es el propio R?. 


21. Los primeros cuatro polinomios de Hermite son 1, 2t, —2 + 42, 
y —121 + 817. Estos polinomios surgen de forma natural en el 
estudio de ciertas ecuaciones diferenciales importantes en física 
matemática.? Demuestre que los primeros cuatro polinomios de 
Hermite forman una base de P3. 


22. Los primeros cuatro polinomios de Laguerre son 1, 1 — t, 
2 — 4t + P,y6-— 181 + 91? — 1%, Demuestre que estos poli- 
nomios forman una base de [P3. 


23. Sea B la base de [P3 que consta de los polinomios de Hermite 
en el ejercicio 21, y sea p(t) = —1 + 812 + 813. Encuentre el 
vector de coordenadas de p respecto de B. 





24. Sea B la base de [Pz que consiste en los tres primeros polino- 
mios de Laguerre listados en el ejercicio 22, y sea p(t) = 5 + 
5t — 21?. Encuentre el vector de coordenadas de p respecto 
de B. 


25. Sea S un subconjunto de un espacio vectorial V de dimen- 
sión n, y suponga que S contiene menos de n vectores. Explique 
por qué S no puede generar a V. 


26. Sea H un subespacio de dimensión n de un espacio vectorial V 
de dimensión n. Demuestre que H = V. 


27. Explique por qué el espacio [P de todos los polinomios es un 
espacio de dimensión infinita. 


2 Véase Introduction to Functional Analysis, 2a. edición, por A. E. Taylor y 
David C. Lay (Nueva York: John Wiley 8 Sons, 1980), pp. 92-93. También se 
analizan otros conjuntos de polinomios. 
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28. Demuestre que el espacio C((R) de todas las funciones continuas 
definidas en la recta real es un espacio de dimensión infinita. 


En los ejercicios 29 y 30, V es un espacio vectorial de dimensión 
finita diferente de cero, y los vectores mencionados pertenecen a V. 
Marque cada enunciado como verdadero o falso. Justifique sus res- 
puestas. (Estas preguntas tienen mayor grado de dificultad que las de 
los ejercicios 19 y 20). 


29. a) Si existe un conjunto (v1,..., Vp} que genera a V, entonces 
dim V £ p. 
b) Si existe un conjunto linealmente independiente {v1,..., Vp} 
en V, entonces dim V = p. 


c) Si dim V = p, entonces existe un conjunto generador de 
p + 1 vectores en V. 


30. a) Si existe un conjunto linealmente dependiente (v;,..., Vp} 
en V, entonces dim V £S p. 


b) Si cada conjunto de p elementos en V no genera a V, enton- 
ces dim V > p. 


c) Sip = 2 y dim V = p, entonces cada conjunto de p — 1 
vectores distintos de cero es linealmente independiente. 


Los ejercicios 31 y 32 se refieren a espacios vectoriales V y W de 
dimensión finita y a una transformación lineal T: V—> W. 


31. Sea H un subespacio distinto de cero de V, y sea T(H) el con- 
junto de imágenes de vectores en H. Entonces, T(H) es un sub- 
espacio de W, de acuerdo con el ejercicio 35 en la sección 4.2. 
Demuestre que dim 7(H) = dim H. 


32. Sea H un subespacio distinto de cero de V, y suponga que T es 
un mapeo uno a uno (lineal) de V en W. Demuestre que dim 
T(H) = dim H. Si resulta que T es un mapeo uno a uno de V 
sobre W, entonces dim V = dim W. Espacios vectoriales iso- 
morfos de dimensión finita tienen la misma dimensión. 


33. [M] De acuerdo con el teorema 11, un conjunto lineal- 
mente independiente {v1,..., Vg} en R” se puede expandir a 
una base para R”. Una manera de hacer esto es crear A = [v; + 
Vę €+ e], siendo e;,..., €, las columnas de la matriz iden- 
tidad; las columnas pivote de A forman una base para R”. 


a) Utilice el método descrito para ampliar los siguientes vec- 
tores a una base para R5: 


—9 9 6 
-7 4 7 | 
v = 8 |, vV = Hf; V3 = —8 
-5 6 5 
7 -7 -7 
b) Explique por qué funciona en general el método: ¿por qué 
están los vectores originales v;,..., Vx incluidos en la base 


encontrada para Col A? ¿Por qué es Col A = R”? 


34. [M] Sea B = {1, cos t, cos? t,..., cosê t} y C = {1, cos t, 
cos 2t,..., cos 6t}. Suponga las siguientes identidades trigo- 
nométricas (véase el ejercicio 37 de la sección 4.1). 


cos 2t = —1 + 2 cos? t 

cos 3t = —3 cos t + 4 cos? t 

cos 4t = 1 — 8 cos? t + 8cost t 

5cost — 20 cos? t + 16 cos? t 

—1 + 18 cos? t — 48 cost t + 32 cossé t 


cos 5t 


cos 6t 


Sea H el subespacio de funciones generado por las funciones 
en B. Entonces B es una base para H, de acuerdo con el ejerci- 
cio 38 de la sección 4.3. 


a) Escriba los vectores de B-coordenadas de los vectores en C, 
y utilícelos para demostrar que C es un conjunto linealmente 
independiente en H. 


b) Explique por qué C es una base para H. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Falso. Considere el conjunto (0). 


2. Verdadero. De acuerdo con el teorema del conjunto generador, $ contiene una base 
para V; llamémosla base S'. Así, T contendrá más vectores que S”. De acuerdo con el 
teorema 9, Tes linealmente dependiente. 


4.6 | RANGO 


Con la ayuda de los conceptos de espacio vectorial, esta sección ofrece una perspectiva des- 
de el interior de una matriz y revela varias relaciones interesantes y útiles, ocultas en sus filas 


y columnas. 


Por ejemplo, imagine que se colocan 2000 números aleatorios en una matriz A de 
40 x 50 y después se determina el número máximo de columnas linealmente independientes 
de A y el número máximo de columnas linealmente independientes de A? (filas de A). De 
manera sorprendente, los dos números son iguales. Como pronto veremos, su valor común 
es el rango de la matriz. Para explicar por qué, necesitamos examinar el subespacio genera- 


do por las filas de A. 
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El espacio fila 


Si A es una matriz de m x n, cada fila de A tiene n entradas y, por lo tanto, se puede identifi- 
car con un vector en R”. El conjunto de todas las combinaciones lineales de los vectores fila 
se denomina espacio fila de A y se denota como Fila A. Cada fila tiene n entradas, por lo que 
Fila A es un subespacio de R”. Ya que las filas de A se identifican con las columnas de Af, 
también podríamos escribir Col A” en lugar de Fila A. 


EJEMPLO 1 Sea 


a a rı = (-2,-5,8,0,-17) 
rahe SE: lle r2 = (1,3,-5, 1,5) 

3 1 -19 7 1 rs = (3, 11,—19,7, 1) 

ACA r4 = (1,7, -13, 5,3) 


El espacio fila de A es el subespacio de R5 generado por {r1, r2, r3, r4}. Es decir, Fila 
A = Gen {r}, r2, r3, r4}. Es natural representar vectores fila de forma horizontal; sin embargo, 
también es posible representarlos como vectores columna si resulta más conveniente. E 


Si supiéramos algo de las relaciones de dependencia lineal entre las filas de la matriz 
A del ejemplo 1, podríamos usar el teorema del conjunto generador para reducir el tamaño 
del conjunto generador a una base. Por desgracia, las operaciones de fila en A no nos dan 
esa información, porque las operaciones de fila cambian las relaciones de dependencia de 
filas. Pero la reducción de filas de A, ¡sin duda vale la pena, como muestra el siguiente 
teorema! 


Si dos matrices A y B son equivalentes por filas, entonces sus espacios fila son iguales. 
Si B está en forma escalonada, las filas de B diferentes de cero forman una base para el 
espacio fila de A, así como para el de B. 


DEMOSTRACIÓN Si B se obtiene a partir de A mediante operaciones de fila, las filas de B 
son combinaciones lineales de las filas de A. De ello se desprende que cualquier combina- 
ción lineal de las filas de B es automáticamente una combinación lineal de las filas de A. 
Así, el espacio fila de B está contenido en el espacio fila de A. Ya que las operaciones de 
fila son reversibles, el mismo argumento indica que el espacio fila de A es un subconjunto 
del espacio fila de B. De manera que los dos espacios fila son iguales. Si B está en forma 
escalonada, sus filas diferentes de cero son linealmente independientes porque ninguna fila 
diferente de cero es una combinación lineal de las filas distintas de cero debajo de esta. 
(Aplique el teorema 4 para las filas diferentes de cero de B en orden inverso, con la primera 
fila como la última). Así, las filas diferentes de cero de B forman una base del espacio fila 
(común) de B y A. E 


El resultado principal de esta sección implica los tres espacios: Fila A, Col A y Nul A. 
El siguiente ejemplo prepara el camino para este resultado y muestra cómo una secuencia de 
operaciones de fila de A conduce a las bases para los tres espacios. 


EJEMPLO 2 Encuentre bases para el espacio fila, el espacio columna y el espacio nulo 
de la matriz 


=2 5S 8&8 0 -17 
1 3 -5 1 5 
3 11 -19 7 1 
1 7-13 5 —3 


A= 
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SOLUCIÓN Para encontrar las bases para el espacio fila y el espacio columna, reduzca A 
por filas a una forma escalonada: 


1 3-5 1 5 
0, TEM 2 -7 
Ab o o 0-4 2% 
o 0 0o 0 o0 


De acuerdo con el teorema 13, las tres primeras filas de B forman una base para el espacio fila 
de A (así como para el espacio fila de B). Así, 


Base para Fila A: {(1, 3, —5, 1, 5), (0, 1, —2, 2, —7), (0, 0, 0, —4, 20) } 


Para el espacio columna, observe a partir de B que los pivotes están en las columnas 1, 2 y 4. 
Por lo tanto, las columnas 1, 2 y 4 de A (no de B) forman una base para Col A: 


—2 —5 0 

1 3 1 

Base para Col A: 3 plaa bl? 
1 7 5 


Considere que cualquier forma escalonada de A proporciona (en sus filas diferentes de cero) 
una base para Fila A y también identifica las columnas pivote de A para Col A. Sin embargo, 
para Nul A, se necesita la forma escalonada reducida. Otras operaciones de fila sobre B dan 
como resultado 


1.0 1 0.1 
Arola oo 1 
0o 0 0 0 0 
La ecuación Ax = 0 es equivalente a Cx = 0, es decir, 
xı + X3 + x5=0 


X2 — 2x3 + 3x5 = 0 
x4 — 5x5 = 0 





Así, xı = —xX3 — X5, X2 = 2x3 — 3x5, x4 = 5x5, CON x3 y x5 como variables libres. Los cálcu- 
los usuales (que se analizan en la sección 4.2) demuestran que 


-1 -1 

2 3 

Base para Nul A: 11, 0 
0 5 
0 1 


Observe que, a diferencia de la base para Col A, las bases para Fila A y Nul A no tienen una 
relación sencilla con las propias entradas de A.' E 


1 Es posible encontrar una base para Fila A que utiliza filas de A. En primer lugar se determina A”, y luego se reduce 
por filas hasta que se encuentren las columnas pivote de A”. Estas columnas pivote de A” son filas de A, y forman una 
base para el espacio fila de A. 


DEFINICIÓN 


TEOREMA 14 
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Advertencia: A pesar de que las tres primeras filas de B en el ejemplo 2 son linealmente 
independientes, es erróneo concluir que las tres primeras filas de A son linealmente indepen- 
dientes. (De hecho, la tercera fila de A es la primera fila multiplicada por 2, más la segunda 
fila multiplicada por 7). Las operaciones de fila pueden cambiar las relaciones de dependencia 
lineal entre las filas de una matriz. 


El teorema del rango 


El siguiente teorema describe las relaciones fundamentales entre las dimensiones de Col A, 
Fila A y Nul A. 


El rango de A es la dimensión del espacio columna de A. 


Puesto que Fila A es igual que Col AT, la dimensión del espacio fila de A es el rango 
de A”. La dimensión del espacio nulo a veces se llama la nulidad de A, aunque no utilizare- 
mos este término. 

Tal vez un lector atento ya haya descubierto la totalidad o parte del siguiente teorema, 
mientras trabajaba con los ejercicios de la sección 4.5 o al leer el ejemplo 2 anterior. 


El teorema del rango 


Las dimensiones del espacio columna y del espacio fila de una matriz A de m x n son 
iguales. Esta dimensión común, el rango de A, también es igual al número de posiciones 
pivote en A y satisface la ecuación 


rango A + dim Nul A = n 


DEMOSTRACIÓN De acuerdo con el teorema 6 de la sección 4.3, rango A es el número de 
columnas pivote de A. De manera equivalente, rango A es el número de posiciones pivote en 
una forma escalonada B de A. Además, puesto que B tiene una fila diferente de cero para cada 
pivote, y como estas filas forman una base para el espacio fila de A, el rango de A también es 
la dimensión del espacio fila. 

A partir de la sección 4.5, la dimensión de Nul A es igual al número de variables libres en 
la ecuación Ax = 0. Dicho de otra manera, la dimensión de Nul A es el número de columnas 
de A que no son columnas pivote. (Es el número de estas columnas, no las columnas mismas, 
lo que se relaciona con Nul A). Como es evidente, 


número de número de columnas | _ | número de 
columnas pivote que no son pivote columnas 


Esto demuestra el teorema. E 


Las ideas que sustentan el teorema 14 se pueden distinguir en los cálculos del ejemplo 2. 
Las tres posiciones pivote en la forma escalonada B determinan las variables básicas e iden- 
tifican los vectores básicos para Col A y Fila A. 


EJEMPLO 3 


a) SiA es una matriz de 7 x 9 con un espacio nulo de dimensión 2, ¿cuál es el rango de A? 


b) ¿Podría una matriz de 6 x 9 tener un espacio nulo de dimensión 2? 
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SOLUCIÓN 
a) Puesto que A tiene 9 columnas, (rango A) + 2 = 9; por lo tanto, rango A =7. 


b) No. Si una matriz de 6 x 9, llamémosla B, tuviera un espacio nulo de dimensión 2, tendría 
rango 7, de acuerdo con el teorema del rango. Sin embargo, las columnas de B son vec- 
tores en R6, de manera que la dimensión de Col B no puede ser superior a 6; es decir, el 
rango de B no puede ser mayor que 6. E 


El siguiente ejemplo proporciona una buena forma de visualizar los subespacios que 
hemos estudiado. En el capítulo 6 se verá que Fila A y Nul A tienen solo el vector cero 
en común y, en realidad, son “perpendiculares” entre sí. Este mismo hecho se aplicará a 
Fila A7 (= Col A) y Nul 4”. Por lo tanto, la figura 1, que acompaña al ejemplo 4, crea una 
buena imagen mental para el caso general. (El valor de estudiar A” junto con A se demues- 
tra en el ejercicio 29). 


3 0-1 
EJEMPLO 4 Sea A=|3 0 —1 |. Se comprueba rápidamente que Nul A es el 
4 0 5 


eje x2, Fila A es el plano x1x3, Col A es el plano cuya ecuación es xı — x2 = 0, y Nul AT es 
el conjunto de todos los múltiplos de (1, —1, 0). La figura 1 muestra Nul A y Fila A en el 
dominio de la transformación lineal x > Ax; el rango de este mapeo, Col A, se muestra en 
una copia separada de R°, junto con Nul AF. E 


pe’ 





FIGURA 1 Subespacios determinados por una 
matriz A. 


Aplicaciones para sistemas de ecuaciones 


El teorema del rango es una poderosa herramienta para el procesamiento de información 
sobre los sistemas de ecuaciones lineales. El siguiente ejemplo simula la forma como se 
plantearía un problema de la vida real utilizando ecuaciones lineales, sin mencionar explíci- 
tamente términos de álgebra lineal, como matriz, subespacio y dimensión. 


EJEMPLO 5 Un científico encontró dos soluciones para un sistema homogéneo de 40 
ecuaciones con 42 variables. No son múltiplos las dos soluciones, y todas las demás solucio- 
nes se pueden desarrollar sumando múltiplos adecuados de estas dos soluciones. ¿Puede el 
científico estar seguro de que un sistema no homogéneo asociado (con los mismos coeficien- 
tes) tiene una solución? 


SOLUCIÓN Sí. Sea A una matriz de coeficientes de 40 x 42 del sistema. La información 
dada implica que las dos soluciones son linealmente independientes y generan Nul A. Así que 
dim Nul A = 2. De acuerdo con el teorema del rango, dim Col A = 42 — 2 = 40. Como R4 
es el único subespacio de R® cuya dimensión es 40, Col A debe ser todo de R*. Esto signi- 
fica que cada ecuación no homogénea Ax = b tiene una solución. E 


TEOREMA 
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El rango y el teorema de la matriz invertible 


Los distintos conceptos de espacios vectoriales asociados a una matriz proporcionan varios 
enunciados adicionales al teorema de la matriz invertible. Los nuevos enunciados que se listan 
a continuación se deducen del teorema de la matriz invertible original de la sección 2.3. 


El teorema de la matriz invertible (continuación) 


Sea A una matriz de n x n. Cada uno de los siguientes enunciados es equivalente a la 
afirmación de que A es una matriz invertible. 


m) Las columnas de A forman una base de R”. 
n) Col A = R” 

o) dim Col A =n 

p) rangoA =n 

q) NulA = {0} 

r) dim Nul A =0 


DEMOSTRACIÓN El enunciado m) es lógicamente equivalente a los enunciados e) y h) 
en relación con la independencia lineal y la generación. Los otros cinco enunciados están 
vinculados a los anteriores del teorema mediante la siguiente cadena de implicaciones casi 
triviales: 


g&)=>n)=>0)>p)>r)>q)=> d) 


El enunciado g), el cual dice que la ecuación Ax = b tiene al menos una solución para cada b 
en R”, implica a n), porque Col A es precisamente el conjunto de todas las b tales que la 
ecuación Ax = b es consistente. Las implicaciones n) = 0) => p) se deducen de las defini- 
ciones de dimensión y rango. Si el rango de A es n, el número de columnas de A, enton- 
ces dim Nul A = 0, de acuerdo con el teorema del rango, y Nul A = {0}. Por lo tanto, 
p) = r) => q). Además, q) implica que la ecuación Ax = 0 tiene solamente la solución tri- 
vial, que es el enunciado d). Como ya se sabe que los enunciados d) y g) son equivalentes al 
enunciado de que A es invertible, la demostración está completa. 5 


Nos hemos abstenido de agregar al teorema de la matriz invertible enunciados evidentes 
acerca del espacio fila de A, ya que el espacio fila es el espacio columna de A”. Recuerde el 
enunciado (1) del teorema de la matriz invertible, el cual afirma que A es invertible si y solo 
si A7 es invertible. Por lo tanto, cada enunciado en el teorema de la matriz invertible también 
se puede establecer respecto de A”. Pero hacer esto duplicaría la longitud del teorema y se 
obtendría una lista ¡de más de 30 enunciados! 


236 CAPÍTULO 4 Espacios vectoriales 


NOTA NUMÉRICA 





Muchos algoritmos analizados en este libro son útiles para comprender conceptos y 
efectuar cálculos sencillos a mano. Sin embargo, los algoritmos a menudo son inade- 
cuados para los grandes problemas que surgen en la vida real. 

La determinación de un rango es un buen ejemplo. Tal vez parezca fácil reducir 
una matriz a la forma escalonada y contar los pivotes. Pero, a menos que se realice 
aritmética exacta en una matriz cuyas entradas se especifiquen con exactitud, las opera- 
ciones de fila pueden cambiar el rango aparente de una matriz. Por ejemplo, si el valor 


de x en la matriz | E | no se almacena exactamente como 7 en una computadora, 


entonces el rango podría ser 1 o 2, dependiendo de si la computadora trata o no a 
x — 7 como cero. 

En las aplicaciones prácticas, el rango efectivo de una matriz A con frecuencia se 
determina a partir de la descomposición en valores singulares de A, que se analizará 
en la sección 7.4. Esta descomposición también es una fuente confiable de bases para 
Col A, Fila A, Nul A y Nul 4”. 


PROBLEMAS DE PRÁCTICA 
Las matrices que se muestran a continuación son equivalentes por filas. 


2 -1 1 —6 8 
1-2 -4 3 -2 
a 7 8 10 3 -—10|” T 


4 -5 7 0 4 


A. a a 


O O Om 
o 
o 
o 
o 


1. Determine rango A y dim Nul A. 
2. Encuentre bases para Col A y Fila A. 
3. ¿Cuál es el siguiente paso a realizar con la finalidad de encontrar una base para Nul A? 
4. ¿Cuántas columnas pivote están en una forma escalonada por filas de 47? 
En los ejercicios 1 a 4, suponga que la matriz A es equivalente por T2 6 -6 6 3 6 
filas a B. Sin hacer cálculos, liste rango de A y dim Nul A. Luego, 3 A= —2 -3 6 -3 0 -6 
encuentre las bases para Col A, Fila A y Nul A. ae 4 9 -12 9 3 12| 
maei 9 -7 o a pS 
1. A4A=|-1 2 —4 1j, E 
0 3 0 3 3 0 
| 5 -6 10 7 B= 
A o 0 0 0 3 a] 
NE E E o [o 0 0 0 0 0 
LO 0 0 0 pi i2 0 1-2 
1 2 -3 0 -2 -3 
P1 3 4 —1 2 4. A=|1 -—1 0.0 1 6 |, 
2. A= 2 6 6 0 —3 1-2 2 1 -3 0 
213 9 3 6 3 r L1 -2 1 0 2 -l1 
|3 9 0 9 0 [1 1 2 0 P 
[1 3 4 -l 2 0 1 -1 0 —3 -1 
B= 0.0 1 -1 1 B=|0 0 1 1 -13 -1 
10 0 0 0-5 0.0 0. 0 1 —1 
¡[0 0 0 0 Ọ 0o 0 0 0 0 1 








5. Si una matriz A de 4 x 7 tiene rango 3, determine dim Nul A, 
dim Fila A y el rango de A”. 


6. Si una matriz A de 7 x 5 tiene rango 2, determine dim Nul A, 
dim Fila A y el rango de A”. 


7. Suponga que una matriz A de 4 x 7 tiene cuatro columnas 
pivote. ¿Es Col A = R‘? ¿Es Nul A = [R3? Explique sus 
respuestas. 


8. Supongamos que una matriz A de 6 x 8 tiene cuatro columnas 
pivote. ¿Cuál es la dim Nul A? ¿Es Col A = R4? ¿Por qué? 





9. Si el espacio nulo de una matriz A de 4 x 6 es de dimensión 3, 
¿cuál es la dimensión del espacio columna de A? ¿Es Col A = 
R3? ¿Por qué? 


10. Si el espacio nulo de una matriz A de 8 x 7 es de dimensión 5, 
¿cuál es la dimensión del espacio columna de A? 


11. Si el espacio nulo de una matriz A de 8 x 5 es de dimensión 3, 
¿cuál es la dimensión del espacio fila de A? 


12. Si el espacio nulo de una matriz A de 5 x 4 es de dimensión 2, 
¿cuál es la dimensión del espacio fila de A? 


13. Si A es una matriz de 7 x 5, ¿cuál es el mayor rango posible 
de A? Si A es una matriz de 5 x 7, ¿cuál es el mayor rango posi- 
ble de A? Explique sus respuestas. 


14. SiA es una matriz de 5 x 4, ¿cuál es la mayor dimensión posible 
del espacio fila de A? Si A es una matriz de 4 x 5, ¿cuál es la 
máxima dimensión posible del espacio fila de 4? Explique sus 
respuestas. 


15. SiA es una matriz de 3 x 7, ¿cuál es la menor dimensión posible 
de Nul 4? 


16. Si A es una matriz de 7 x 5, ¿cuál es la menor dimensión posi- 
ble de Nul 4? 


En los ejercicios 17 y 18, A es una matriz de m x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 


17. a) El espacio fila de A es el mismo que el espacio columna 
de AT. 


b) Si B es cualquier forma escalonada de A, y si B tiene tres 
filas diferentes de cero, entonces las tres primeras filas de 
A forman una base para Fila A. 


c) Las dimensiones del espacio fila y el espacio columna de A 
son iguales, incluso si A no es cuadrada. 


d) La suma de las dimensiones del espacio fila y el espacio nulo 
de A es igual al número de filas en A. 


e) En una computadora, las operaciones de fila pueden modi- 


ficar el rango aparente de una matriz. 


18. a) Si B es cualquier forma escalonada de A, entonces las co- 
lumnas pivote de B forman una base para el espacio columna 
de A. 


b) Las operaciones de fila preservan las relaciones de depen- 
dencia lineal entre las filas de A. 


c) La dimensión del espacio nulo de A es el número de colum- 
nas de A que no son columnas pivote. 


d) El espacio fila de AT es igual que el espacio columna de A. 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 
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e) Si A y B son equivalentes por filas, entonces sus espacios fila 
son iguales. 


Suponga que todas las soluciones de un sistema homogéneo de 
cinco ecuaciones lineales con seis incógnitas son múltiplos 
de una solución diferente de cero. ¿El sistema necesariamente 
tendrá una solución para cada posible elección de las constantes 
en el lado derecho de las ecuaciones? Explique su respuesta. 


Suponga que un sistema no homogéneo de seis ecuaciones li- 
neales con ocho incógnitas tiene una solución, con dos variables 
libres. ¿Es posible cambiar algunas constantes en los miembros 
derechos de las ecuaciones para hacer que el nuevo sistema sea 
inconsistente? Explique su respuesta. 


Suponga que un sistema no homogéneo de nueve ecuaciones 
lineales con 10 incógnitas tiene una solución para todas las po- 
sibles constantes de los miembros derechos de las ecuacio- 
nes. ¿Es posible encontrar dos soluciones diferentes de cero 
del sistema homogéneo asociado que no sean múltiplos una de 
la otra? Analice. 


¿Es posible que todas las soluciones de un sistema homogéneo 
de 10 ecuaciones lineales con 12 variables sean múltiplos de 
una solución fija diferente de cero? Analice. 


Un sistema homogéneo de 12 ecuaciones lineales con ocho in- 
cógnitas tiene dos soluciones fijas que no son múltiplos una de 
la otra, y todas las demás soluciones son combinaciones lineales 
de estas dos soluciones. ¿Puede describirse el conjunto de todas 
las soluciones con menos de 12 ecuaciones lineales homogé- 
neas? Si es así, ¿con cuántas? Analice. 


¿Es posible que un sistema no homogéneo de siete ecuaciones 
con seis incógnitas tenga una solución única para algún con- 
junto de constantes del miembro derecho? ¿Es posible que este 
sistema tenga una solución única para cada miembro derecho? 
Explique sus respuestas. 


Un científico resuelve un sistema no homogéneo de 10 ecua- 
ciones lineales con 12 incógnitas y encuentra que tres de las 
incógnitas son variables libres. ¿Puede el científico estar seguro 
de que, si se cambia el lado derecho de las ecuaciones, el nuevo 
sistema no homogéneo tendrá una solución? Analice. 


En teoría estadística, un requisito común es que una matriz sea 
de rango completo. Es decir, el rango debe ser tan grande como 
sea posible. Explique por qué una matriz de m x n con más filas 
que columnas tiene rango completo si y solo si sus columnas 
son linealmente independientes. 


Los ejercicios 27 a 29 se refieren a una matriz A de m x n y a lo que 
con frecuencia se denomina los subespacios fundamentales deter- 
minados por A. 


27. 


28. 


29. 


¿Cuál de los subespacios Fila A, Col A, Nul A, Fila A”, Col A7 
y Nul A" están en R” y cuáles están en R”? ¿Cuántos subespa- 
cios distintos están en esta lista? 

Justifique las siguientes igualdades: 

a) dim Fila A + dim Nul A =n Número de columnas de A 
b) dim Col A + dim Nul A” = m Número de filas de A 

Con base en el ejercicio 28, explique por qué la ecuación 


Ax = b tiene una solución para toda b en R” si y solo si la ecua- 
ción A7x = 0 tiene solamente la solución trivial. 
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30. Suponga que A es m x n y b está en [R”. ¿Qué tiene que ser 
verdad acerca del rango de [A b] y el rango A para que la ecua- 
ción Ax = b sea coherente? 


Las matrices con rango 1 son importantes en algunos algoritmos 
de computadora y varios contextos teóricos, incluyendo la des- 
composición en valores singulares del capítulo 7. Es posible demos- 
trar que una matriz A de m x n tiene rango 1 si y solo si se trata 
de un producto externo, es decir, A = uv” por alguna u en R” y 
v en R”. Los ejercicios 31 a 33 sugieren por qué esta propiedad 
es verdadera. 


2 a 
31. Compruebe que el rango de uv? < 1 siu=| —3 |yu=| b 
5 c 

|! 3 EA 7 

32. seu = [ » | Encuentre ven R al que | Ze s= x 


33. Sea A cualquier matriz de 2 x 3 tal que rango A = 1. Sea u 
la primera columna de A, y suponga que u + 0. Explique 
por qué hay un vector v en R? tal que A = uv”. ¿Cómo po- 
dría modificarse esta construcción si la primera columna de A 
fuera cero? 


34. Sea A una matriz de m x n de rango r > 0, y sea U una forma 
escalonada de A. Explique por qué existe una matriz invertible 
E tal que A = EU, y utilice esta factorización para escribir A 
como la suma de r matrices con rango 1. [Sugerencia: Véase el 
teorema 10 de la sección 2.4]. 


35. 


36. 


37. 


38. 


PARAS e E 
HA AN 5 s| 
[M]Sea4A=| 5-7 -6 5-6 2 8! 
zgn S Baa EA 3 


6 -8 -5 4 4 9 3 


a) Construya matrices C y N, cuyas columnas son las bases 
para Col A y Nul A, respectivamente, y construya una matriz 
R cuyas filas formen una base para Fila A. 


b) Construya una matriz M cuyas columnas formen una 
base para Nul A7, construya las matrices $ = [RT N] y 
T = [C M], y explique por qué S y T deberían ser cua- 
dradas. Compruebe que tanto § como T son invertibles. 


[M] Repita el ejercicio 35 para una matriz aleatoria A de 
6 x 7 con valores enteros y rango de 4 o menor. Una manera 
de construir A es crear una matriz aleatoria J de 6 x 4 con 
valores enteros y una matriz aleatoria K de 4 x 7 con valores 
enteros, y establecer que A = JK. (Véase el ejercicio comple- 
mentario 12 al final del capítulo; véase también la Guía de estu- 
dio para los programas de generación de matrices). 


[M] Sea A la matriz del ejercicio 35. Construya una matriz C 
cuyas columnas sean las columnas pivote de A, y construya una 
matriz R cuyas filas sean las filas diferentes de cero de la forma 
escalonada reducida de A. Calcule CR, y analice sus hallazgos. 


[M] Repita el ejercicio 37 para tres matrices aleatorias A de 
5 x 7 con valores enteros y rangos de 5, 4 y 3. Haga una con- 
jetura acerca de cómo se relaciona CR con A para cualquier 
matriz A. Demuestre su suposición. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. A tiene dos columnas pivote, por lo que rango A = 2. Puesto que A tiene 5 columnas en 


total, dim Nul A = 5-2 =3. 


2. Las columnas pivote de A son las dos primeras columnas. Por lo tanto, una base para 


Col A es 


{a1, a2} = 


Las filas diferentes de cero de B forman una base para Fila A, a saber, {(1, —2, —4, 
3, —2), (0, 3, 9, —12, 12)}. En este ejemplo en particular, resulta que dos filas cuales- 
quiera de A forman una base para el espacio fila, ya que el espacio fila es de dimensión 
2 y ninguna de las filas de A es un múltiplo de otra fila. En general, las filas diferentes 
de cero de una forma escalonada de A se deberían utilizar como base para Fila A, y no 


las filas de A. 


3. Para Nul A, el siguiente paso es llevar a cabo operaciones de fila en B para obtener la 
forma escalonada reducida de A. 


4. Rango AT = rango A, de acuerdo con el teorema del rango, ya que Col AT = Fila A. 
De manera que A” tiene dos posiciones pivote. 
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4.7 | CAMBIO DE BASE 


Cuando se elige una base B para un espacio vectorial V de dimensión n, el mapeo de coorde- 
nadas asociado a R” proporciona un sistema de coordenadas para V. Se identifica cada x en V 
únicamente por su vector de [5-coordenadas, [ x ] g 

En algunas aplicaciones, se describe un problema inicialmente usando una base B, pero 
la solución del problema se facilita cambiando B a una nueva base C. (Se darán ejemplos en 
los capítulos 5 y 7). A cada vector se le asigna un nuevo vector de C-coordenadas. En esta 
sección se estudia cómo [x ], y [x], se relacionan para toda x en V. 

Para visualizar el problema, considere los dos sistemas de coordenadas de la figura 1. En 
la figura la), x = 3b; + bz, mientras que en la figura 1b), la misma x se muestra como x = 


6c, + 4c,. Es decir, 
3 6 
[ls =[5] y ts1.=[¿] 


Nuestro problema es encontrar la conexión entre los dos vectores de coordenadas. El ejem- 
plo 1 muestra cómo hacer esto, siempre que se conozca cómo se forman b; y b, a partir 
de C1 y C>. 






































a) b) 


FIGURA 1 Dos sistemas de coordenadas para el mismo espacio vectorial. 


EJEMPLO 1 Considere dos bases B = [b,,b»,) y C = ([e,,c>) de un espacio vectorial 


V, de manera que 
b¡=4e,+€ y b,=-6c¡ +C, (1) 
Suponga que 
x = 3b; + b2 (2) 


Es decir, suponga que [x ],¿ = | A i Encuentre [ x ].. 


SOLUCIÓN Aplique el mapeo de coordenadas determinado por C a x en la ecuación (2). 
Puesto que el mapeo de coordenadas es una transformación lineal, 
[x]¿ = [3b1 + b> ]. 
= 3[b; ], + [b» ], 


Podemos escribir esta ecuación vectorial como una ecuación matricial, utilizando los vectores 
en la combinación lineal como las columnas de una matriz: 


(xo =[Ubrlo  1b2J0]| | 6) 


l Piense en [| x ]g como un “nombre” de x que lista los pesos utilizados para construir x como una combinación lineal 
de los vectores básicos en B. 
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Esta fórmula da [ x |, una vez que se conocen las columnas de la matriz. A partir de (1), 


mi =[1] e] 


Por lo tanto, la ecuación (3) da la solución: 
PA 4 -6||3| _ |6 
cC |1 1[1| |4 
Las C-coordenadas de x coinciden con las de x en la figura 1. E 


El argumento que se utiliza para deducir la fórmula (3) se puede generalizar para obtener 
el siguiente resultado. (Véase los ejercicios 15 y 16). 


TEOREMA 15 Sean B = ([b;,...,b,) y C = {¢1,..., Cn} las bases de un espacio vectorial V. Entonces, 
existe una única matriz 4 E den xn tal que 


El. E (4) 

Las columnas de E Eh son los vectores de C-coordenadas de los vectores en la base B. 
Es decir, 

Lo = [Ibid bal. > Ib,J¿] (5) 


La matriz è Es en el teorema 15 se denomina matriz de cambio de coordenadas de 8 
e 
a C. La multiplicación por cti convierte a las B-coordenadas en las C-coordenadas.? 
i 


La figura 2 ilustra la ecuación de cambio de coordenadas (4). 


V 
x 
[le [ lg 
multiplicación 
kxe por P [x]g 
CB 
R” R” 


FIGURA 2 Dos sistemas de coordenadas para V. 


Las columnas de 7 Po son linealmente independientes porque son los vectores de coor- 
— 


denadas del conjunto linealmente independiente B. (Véase el ejercicio 25 de la sección 4.4). 
Puesto que z Er es cuadrada, debe ser invertible, de acuerdo con el teorema de la matriz 


invertible. Multiplicando por la izquierda ambos lados de la ecuación (4) por le E se 
obtiene 


(Es) ll = [x] 


2 Para recordar cómo se construye la matriz, piense en como en una combinación lineal de las colum- 


c£ólx 1% 


nas de g Le El producto matriz-vector es un vector de C-coordenadas, de modo que las columnas de é Es 


también deberían ser los vectores de C-coordenadas. 
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Por lo tanto, (e Lay! es la matriz que convierte las B-coordenadas en C-coordenadas. 


Es decir, 


(CENT ces (6) 


Cambio de base en R” 


Si B = ([b;,...,b,) y € es la base estándar (e;,..., e, ) en R”, entonces [bı]e = bi, y lo mismo 
para los otros vectores en B. En este caso, ¿ E; es igual a la matriz de cambio de coordenadas 
Pg que se presentó en la sección 4.4, a saber, 


Pg= [bi b2 > b,] 


Para cambiar las coordenadas entre dos bases que no son estándar en R”, se necesita el 
teorema 15. El teorema demuestra que para resolver el problema de cambio de base, se nece- 
sitan los vectores de coordenadas de la antigua base respecto de la nueva base. 


EJEMPLO 2 Sean b; = È b = a c = Sl c2 = M y considere 


las bases de R? dadas por B = {b;, b2} y C = {c1, c2}. Encuentre la matriz de cambio de 
coordenadas de Ba C. 


SOLUCIÓN La matriz c Pe implica a los vectores de C-coordenadas de b; y bv. 


Sean [b |, = ES | y [b2]; = 71 Así, por definición, 


[e elfy |=» y le elly |=» 


y2 


Para resolver ambos sistemas simultáneamente, se aumenta la matriz de coeficientes con b; 
y b2, y se reduce por filas: 


COB ES E 1 0: 6 4 
[e c2 | bi ba]=|_, LA j R I5 2 0 


ml =[_5] y e=] s] 


La matriz del cambio de coordenadas deseada es, por consiguiente, 
6 4 

cg = [Ibi le (mal. ]=|_£ | E 

Observe que la matriz ¿ Lx del ejemplo 2 ya apareció en la ecuación (7). Esto no es 


sorprendente, ya que la primera columna de ¿ Pa resulta de reducir por filas [e, cz! bi]a 


U i| [bı] ch y de manera similar para la segunda columna de ¿ Pi Por lo tanto, 
[er e ib b2] ~ [Z | cg] 


Un procedimiento análogo funciona para encontrar la matriz de cambio de coordenadas entre 
dos bases cualesquiera en R”. 
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4.7 


EJERCICIOS 


EJEMPLO 3 Sea b; = [3 b, = [a e = k Cc) = [75 | y considere las 


bases para R? dadas por B = {b;, b2} y C = {c1, e2). 
a) Determine la matriz de cambio de coordenadas de C a B. 


b) Encuentre la matriz de cambio de coordenadas de Ba C. 


SOLUCIÓN 


a) Considere que y Pe se necesita más que o P g Y calcule 


i E 1 0:5 3 
[bi b |c e]=|_; 4i 9 solo 116 A 


P _ i A 
B<=C 6 4 


b) De acuerdo con el inciso a) y la propiedad (6) anterior (con B y C intercambiadas), 


E 1[ 4 3 2 -3/2 
cs = (go) aa |- E A E 


Otra descripción de la matriz de cambio de coordenadas P g Utiliza las matrices de 


Por lo tanto, 


cambio de coordenadas Pg y Pc que convierten a las coordenadas B y C, respectivamente, en 


coordenadas estándar. Recuerde que para cada x en R”, 
Psi] =x, Pelxle=x y lle = P¿'x 


Por lo tanto, 


[xJe = P¿*x = P¿* Plxlé 


En R”, la matriz de cambio de coordenadas c ES se puede calcular como Pg f Pg. En realidad, 
para matrices más grandes que 2 x 2, un algoritmo similar al del ejemplo 3 es más rápido que 


calcular Po ly luego Pe l Pg. Véase el ejercicio 12 en la sección 2.2. 


PROBLEMAS DE PRÁCTICA 


1. Sean F = {fi, f2} y G = [g1, g2) bases para un espacio vectorial V, y sea P una ma- 
triz cuyas columnas son [f;]g y [£>]g. ¿Cuál de las siguientes ecuaciones satisface P para 
toda v en V? 

i. [vir = Plvlg ii. [v]o = Plvlr 


2. Sean B y C como en el ejemplo 1. Utilice los resultados de ese ejemplo para encontrar la 
matriz de cambio de coordenadas de Ca B. 


1. Sean B = (bi, b2} y C = {c1, c2} bases para un espacio vecto- 2. Sean B = (b1, b>) y C = {c1, c2} bases para un espacio vecto- 
rial V y suponga que bı = 6cı — 2c2 y b2 = 9c; — 4c2. rial V, y suponga que b; = —2c1 + 4e, y b, = 3c, — 6c>. 
a) Encuentre la matriz de cambio de coordenadas de $ a C. a) Encuentre la matriz de cambio de coordenadas de Ba C. 


b) Encuentre [x]¿ para x = —3b, + 2b». Utilice el inciso a). b) Determine [x]¿ para x = 2b; + 3b,. 


3. Sean U = {u;, u2} y W = {w1, w2} bases para V, y sea P una 
matriz cuyas columnas son [u;],,, y [u),,. ¿Cuál de las si- 
guientes ecuaciones satisface P para toda x en V? 


i. Ky = PE ii. [x],, = PIxl, 
4. Sean A = {a;, a2, a3} y D = {d;, d2, d3} bases para V, y sea 


P[[d;] la [d2] A [d3] al- ¿Cuál de las siguientes ecuaciones sa- 


tisface P para toda x en V? 
i. [x]; = Plxl, ii.  [xlo= Plxla 


5. Sean A = (aj, az, az) y B= (b,, b,, b3) bases para un espacio 
vectorial V, y suponga que a; = 4b, — b,, az = —b; + b2 + b3, 
y a = b2 — 2b3. 
a) Encuentre la matriz de cambio de coordenadas de A a B. 
b) Determine [x] g Para x = 3a; + 4a + a3. 

6. Sean D = {d;, d2, d3} y F = {f;, f2, f3} bases para un espacio 
vectorial V, y suponga que fı = 2d; — dz + d3, f2 = 3d, + da, 
y f = —3d;ı + 2d}. 


a) Encuentre la matriz de cambio de las coordenadas de F a D. 


b) Determine [x], para x = fı — 2f2 + 2f3. 


En los ejercicios 7 a 10, sean B = [b,, b2) y C = {c1, c2} bases para 
R?. En cada ejercicio, encuentre la matriz de cambio de coordenadas 
de BaC y la matriz de cambio de coordenadas de Ca B. 


1 -[¿]9-[3)a=[5)0-[3] 
e m-[ heeh hei] 
> -[:)9-[+)9-[2)o-[3] 

"a a aa 


En los ejercicios 11 y 12, B y C son bases para un espacio vecto- 
rial V. Marque cada enunciado como verdadero o falso. Justifique 
sus respuestas. 


10. b; zl 


11. a) Las columnas de la matriz de cambio de coordenadas S E 
son vectores de B-coordenadas de los vectores en C. 


B 
b) Si V = R", y Ces la base estándar para V, entonces „ P ges 
igual a la matriz de cambio de coordenadas Pg que se pre- 
sentó en la sección 4.4. 


12. a) Las columnas de č P g Son linealmente independientes. 


b) Si V= R, B= {bi, b2} y C = {c1, c2}, entonces la re- 
ducción por filas de [c] c2 bı b2ļa[/ P] produce una 
matriz P que satisface [x] g = Plx], para toda x en V. 


13. En P,, encuentre la matriz de cambio de coordenadas de la base 
B= (1-21 + 12,3 — 5t + 4r, 2t + 3t} a la base estándar 
de C = {1, t, £}. Luego, encuentre el vector de -coordenadas 
para —1 + 2t. 


14. En P,, encuentre la matriz de cambio de coordenadas de la 
base B = {1 — 32,2 + 1— 5, 1 + 2t} a la base estándar. 
Luego, escriba 1? como una combinación lineal de los polino- 
mios en B. 
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Los ejercicios 15 y 16 brindan una demostración del teorema 15. 
Complete la justificación para cada paso. 


15. Dada v en V, existen escalares xj,..., Xy, tales que 
y= xıbı + xX2b2 Tean Xn Dn 


porque a) . Aplique el mapeo de coordenadas determi- 
nado por la base C, y obtenga 


[vle E x1[b1]¿ + X2[b2], + e. Xnlbnle 


porque b) . Esta ecuación se puede escribir en la forma 
X1 

[vle = [[bile [bz]e [ba]e]| : (8) 
Xn 


de acuerdo con la definición de c) . Esto indica que 


i P 
la matriz E 


lvl. = č E gly] g para toda v en V, porque el vector del lado 


derecho en (8) es d) ; 


que se muestra en la ecuación (5) satisface 


16. Suponga que Q es cualquier matriz de manera que 
[vle = Q[v]; para toda v en V (9) 


Establezca v = b; en la ecuación (9). Después (9) indica que 
[bı] es la primera columna de Q porque a) . De ma- 
nera similar, para k = 2,..., n, la k-ésima columna de Q es 
b) porque c) . Esto indica que la matriz „ £ g defi- 
nida por (5) en el teorema 15 es la única matriz que satisface la 
condición (4). 


17. [M] Sea B = {X0,..., X6} y C = {y0,..., Y6}, donde xp es la 
función cosf £ y y, es la función cos kt. El ejercicio 34 de 
la sección 4.5 mostró que tanto B como C son bases para el 
espacio vectorial H = Gen {X0,..., X6}. 


a) Sea P =[ [Yo]; 

b) Explique por qué las columnas de P”! son los vectores de 
C-coordenadas de Xo,..., Xo. Después, utilice estos vectores 
de coordenadas para escribir identidades trigonométricas 
que expresen potencias de cos £ en términos de las funciones 
en C. 


[Y6 ls } y calcule P7!. 


18. [M] (Se requiere cálculo) Recuerde de sus clases de cálculo 
que las integrales como 


fo cos? 1 —6c0s* 1 + 5cos? t — 12 cosf t) dt (10) 


son tediosas de calcular. (El método habitual es aplicar inte- 
gración por partes varias veces y usar la fórmula de la mitad del 
ángulo). Utilice la matriz P o P”! del ejercicio 17 para trans- 
formar (10), y después calcule la integral. 


3 La idea de los ejercicios 17 y 18 y cinco ejercicios relacionados en las sec- 
ciones anteriores provienen de un documento de Jack W. Rogers, Jr., de la 
Universidad de Auburn, presentado en una reunión de la International Linear 
Algebra Society, en agosto de 1995. Véase la sección “Applications of Li- 
near Algebra in Calculus”, American Mathematical Monthly 104 (1), 1997. 
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19. [M] Sea b) Encuentre una base {w;, w2, W3} para R? tal que P es la 
1 2 _1 matriz de cambio de coordenadas de {v1, V2, V3} a {W1, W2, 
P=|-3 -5 ol, wa). 
4 6 1 20. Sean B = (b,, b>), C = [e,, e2) y D = {d;, d2} y bases para 
=9 -8 7 un espacio vectorial de dimensión 2. 
v= 2j, v= S |, v3= 2 a) Escriba una ecuación que relacione las matrices „ P pD P c 


Yo E g: Justifique su resultado. 

b) [M] Utilice un programa de matrices ya sea para ayudar- 
le a encontrar la ecuación o para comprobar la ecuación 

[vi va, v3). [Sugerencia: Pregúntese qué representan las que escribió. Trabaje con tres bases de [R?. (Véase los ejer- 

columnas de , 2 gl- cicios 7 a 10). 


a) Encuentre una base {u;, u2, uz) para R? tal que P es la 
matriz de cambio de coordenadas de {u;, u2, u3} a la base 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Como las columnas de P son vectores de coordenadas G, un vector de la forma Px debe 
ser un vector de coordenadas 6. Por lo tanto, P satisface la ecuación ii. 


2. Los vectores de coordenadas que se encuentran en el ejemplo 1 indican que 


os = [ibile 1bd]=[1 |] 


Por lo tanto, 


Patada a a 6 
BC CER. 10|-1 4 —1 4 


4.8 | APLICACIONES A LAS ECUACIONES EN DIFERENCIAS 


Ahora que se dispone de poderosas computadoras, cada vez más problemas científicos y de 
ingeniería se analizan utilizando datos discretos, o digitales, en lugar de datos continuos. 
Las ecuaciones en diferencias con frecuencia son la herramienta adecuada para analizar 
esos datos. Incluso cuando una ecuación diferencial se utiliza para modelar un proceso con- 
tinuo, a menudo se obtiene una solución numérica a partir de una ecuación en diferencias 
relacionada. 

En esta sección se ponen de relieve algunas propiedades fundamentales de las ecuaciones 
en diferencias lineales que se explican mejor utilizando el álgebra lineal. 


Señales discretas de tiempo 


El espacio vectorial S de las señales discretas de tiempo se presentó en la sección 4.1. 
Una señal en S es una función definida solo con números enteros y se visualiza como una 
secuencia de números, por ejemplo, [yx]. La figura 1 muestra tres señales típicas cuyos tér- 
minos generales son (DA 1 y (= Dr respectivamente. 


y = 7 y = 1 y =D 


2-1.0.1 2 2-1. 012 E] 





FIGURA 1 Tres señales en S. 
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Las señales digitales, desde luego, surgen en ingeniería de sistemas eléctricos y de con- 
trol, pero secuencias de datos discretos también se generan en biología, física, economía, 
demografía y muchas otras áreas, donde se mide un proceso, o se muestrea, en intervalos 
discretos de tiempo. Cuando se inicia un proceso en un momento específico, a veces es con- 
veniente representar una señal como una secuencia de la forma (yo, y1, y2»...). Se supone que 
los términos yz para k < O son cero o simplemente se omiten. 


EJEMPLO 1 El sonido cristalino de un reproductor de discos compactos proviene de 
música de la que se han tomado muestras a una velocidad de 44,100 veces por segundo. Véase 
la figura 2. En cada medición, la amplitud de la señal de música se registra como un número, 
por ejemplo, yx. La música original está compuesta de muchos sonidos diferentes de diversas 
frecuencias; sin embargo, la secuencia [yz] contiene suficiente información para reproducir 
todas las frecuencias en el sonido hasta aproximadamente 20,000 ciclos por segundo, más allá 
de lo que el oído humano puede percibir. E 


t 


FIGURA 2 Datos muestreados a partir de una señal 
de música. 


Independencia lineal en el espacio S de las señales 


Para simplificar la notación, consideramos un conjunto de solo tres señales en S, por ejemplo, 
{uk}, {vk} y {wk}. Son linealmente independientes precisamente cuando la ecuación 


CiUk + C2V0k + C3Wwk =0 para toda k (1) 


implica que c1 = c2 = c3 = 0. La frase “para toda k” significa para todos los enteros: positi- 
vos, negativos y cero. También se podría considerar que las señales comienzan con k = 0, por 
ejemplo; en tal caso, “para toda k” significaría para todos los enteros mayores que o iguales 
a cero (k = 0). 

Suponga que c1, c2, c3 satisfacen la ecuación (1). Entonces la ecuación (1) es válida 
para cualesquiera tres valores consecutivos de k, por ejemplo, k, k + 1 y k + 2. Así, la ecua- 
ción (1) implica que 


C1Uk+1 + C2Uk+1 + C3Wk+1 = 0 para toda k 





C1Uk+2 + C2Uk+2 + C3Wk+2 =0 para toda k 


Por lo tanto c1, c2, c3 satisfacen 





Uk Uk Wk C1 0 
Uk+1 Ux41  Wk+ı c2 | =| 0 | para toda k (2) 
Uk+2  Uk+2 Wk+2 C3 0 














La matriz de coeficientes de este sistema se llama la matriz de Casorati de las señales, y 
el determinante de la matriz se denomina casoratiano de (uz), [vx) y [wx). Si la matriz de 
Casorati es invertible, para al menos un valor de k, entonces la ecuación (2) implicará que 
cı = c2 = c3 = 0, lo que demuestra que las tres señales son linealmente independientes. 
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2+ 
e e. e e. + e. 
2% +22 H— ki 
-4 2 
0 





Las señales 1%, (-2y* y 3% 


EJEMPLO 2 Compruebe que las señales 1*, (-2) y 3* son linealmente independientes. 
SOLUCIÓN La matriz de Casorati es 

14 ay 3k 

14+! EA 3k+1 

14+2 ES 3k+2 
Con las operaciones de fila se puede demostrar muy fácilmente que esta matriz siempre es 


invertible. Sin embargo, es más rápido sustituir k por un valor, por ejemplo, k = 0 y reducir 
por filas la matriz numérica: 


I eol 1 1 1 1 1 1 
1-2 3|=|0-3 2|=|0 -3 2 
1 4 9 0 3 8 0 0 10 


La matriz de Casorati es invertible para k = 0. Por lo tanto, 1*, (-2* y 3* son linealmente 
independientes. E 


Si una matriz de Casorati no es invertible, las señales asociadas que se están sometiendo 
a prueba pueden o no ser linealmente dependientes. (Véase el ejercicio 33). Sin embargo, es 
posible demostrar que si todas las señales son las soluciones de la misma ecuación en diferen- 
cias homogénea (que se describe a continuación), entonces la matriz de Casorati es invertible 
para toda k y las señales son linealmente independientes, o bien, la matriz de Casorati no es 
invertible para toda k y las señales son linealmente dependientes. En la Guía de estudio se 
presenta una excelente demostración utilizando transformaciones lineales. 


Ecuaciones lineales en diferencias 


Considerando los escalares aọ,..., An, CON Ay y A, diferentes de cero, y dada una señal {zg}, 
la ecuación 


A0Yk+n + A1Yk+n-1 +*+ + an—1Yk+1 + anyk =Zk para toda k 6) 


se llama una ecuación lineal en diferencias (o relación de recurrencia lineal) de orden n. 
Para simplificar, ay con frecuencia se considera igual a 1. Si {z} es la secuencia cero, la ecua- 
ción es homogénea; de lo contrario, la ecuación es no homogénea. 


EJEMPLO 3 Enel procesamiento de señal digital, una ecuación en diferencias tal como 
la ecuación (3) describe un filtro lineal, y aọ,..., an se denominan los coeficientes de filtro. 
Si [yx] se trata como la entrada y ([z) como la salida, entonces las soluciones de la ecuación 
homogénea asociada son las señales que se filtran hacia fuera y se transforman en señal cero. 
Vamos a alimentar dos señales diferentes en el filtro 


39) 442 + -SYk+1 4 -35Yk = Zk 


Aquí, .35 es una abreviatura de /2/4. La primera señal se crea mediante el muestreo de 
la señal continua y = cos(7r1/4) para valores enteros de f, como en la figura 3a). La señal 
discreta es 


{yk} = (...,cos(0), cos(77/4), cos(27/4), cos(31/4),...j 


Para simplificar, se escribe +.7 en lugar de +4/2/2, de manera que 
A A A A A A A 
k=0 


La tabla 1 muestra el cálculo de la secuencia de salida [z;), donde .35(.7) es una abreviatura 
de (42/41 V2/2) = .25. La salida es [yx], corrida un término. 
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a) b) 


FIGURA 3 Señales discretas con diferentes frecuencias. 


TABLA 1 Cálculo de la salida de un filtro 
Yk Yk+ı Yk+2 35yk + .5yk+1 + .35yYk+2 = Zk 
LJ 0 351) +57 +.350) = 7 
7 0 -7 INT) +50 +.352=7= 0 
0 -7 -1 350) + .5(—.7) + .35(—1) = —.7 
li 7 .35(—.7) + .5(—1) + .35(—.7) = —1 
0 .35(—1) + .5(—.7) + .35(00) =-.7 
7 .35(—.7) + .50) +357 = 0 





UN A UNa OJN 





Una señal de entrada diferente se produce a partir de la mayor frecuencia de la señal 
y = cos(371£/4), que se muestra en la figura 3b). El muestreo a la misma tasa de antes produce 
una nueva secuencia de entrada: 


MIS —.7, 0, .7, —1, .7, 0, —.7, 1, —.7, 0,...} 
k=0 


Cuando se alimenta al filtro con (wz), la salida es la secuencia cero. El filtro, conocido como 
filtro pasa bajos, hace que (yx) pase, pero detiene a las señales de mayor frecuencia (wz). E 


En muchas aplicaciones, se especifica una secuencia {zę} para el lado derecho de una 
ecuación en diferencias (3), y una [ yz) que satisface la ecuación (3) se considera una solución 
de la ecuación. El siguiente ejemplo ilustra cómo encontrar soluciones para una ecuación 
homogénea. 


EJEMPLO 4 Soluciones de una ecuación homogénea en diferencias a menudo tienen la 
forma y, = r' para alguna r. Encuentre algunas soluciones de la ecuación 


Yk+3 — 2Yx+2 — 5Yx+1 + 6Yx =0 para toda k (4) 


SOLUCIÓN Se sustituye y* por + en la ecuación y se factoriza el lado izquierdo: 


pr art sp tl y pk = 0 © 
r* (r? — 2r? — 5r + 6) =0 
r(r-1)04+2(0-3)=0 (6) 


Como (5) es equivalente a (6), r' satisface la ecuación en diferencias (4) si y solo si r satisface 
(6). Así, 1%, (2) y 3* son todas soluciones de (4). Por ejemplo, para comprobar que 3% es 
una solución de (4), calcule 
343 29.342 _5.34H1 7 6.3% 
=3'(27-18-15+6)=0 para toda k E 
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TEOREMA 16 


TEOREMA 17 


En general, una señal distinta de cero r! satisface la ecuación homogénea en diferencias 
Yen + 01 Y n—1 4 +++ an—1Yk+1 + anyk =O para toda k 
si y solo si r es una raíz de la ecuación auxiliar 
”"+arT+..+aj r+a,=0 


No vamos a considerar el caso en que r es una raíz repetida de la ecuación auxiliar. Cuando 
la ecuación auxiliar tiene una raíz compleja, la ecuación en diferencias tiene soluciones de la 
forma s* cos kw y s' sen kw, para las constantes s y w. Esto sucedió en el ejemplo 3. 


Conjuntos de soluciones de ecuaciones lineales 
en diferencias 


A partir de a;,..., 4,, considere el mapeo T : S > S que transforma una señal (y) en una 
señal {wz} dada por 


Wk = Yk+n + A1Yk+n—1 + '+: + An—1Yk+1 + Anyk 
Es fácil comprobar que T es una transformación lineal. Esto implica que el conjunto solución 
de la ecuación homogénea 


Yk+n + 41Yk+n—-1 +*+ + an—1Yk+1 + 4nyk =O para toda k 


es el núcleo de T (el conjunto de las señales que T mapea en la señal cero) y, por lo tanto, el 
conjunto solución es un subespacio de S. Cualquier combinación lineal de soluciones es de 
nuevo una solución. 

El siguiente teorema, un resultado sencillo, pero básico, conducirá a mayor información 
acerca de los conjuntos solución de ecuaciones en diferencias. 


Si an £ 0 y si {zg} está dada, la ecuación 
Yk+n F A1Yk+n-1 + t + an—1Yk+1 F Anyk = zk para toda k (7) 


tiene una única solución siempre que se especifican yo,..., Yn-1- 


DEMOSTRACIÓN Si yo,..., y»-1 se especifican, utilice la ecuación (7) para definir 
Yn = Zo — [41 Yn-1 +++ + 4-11 + anyo] 


Y ahora que y1,..., Yn se especifican, utilice (7) para definir y, + ¡. En general, utilice la rela- 
ción de recurrencia 
Yntk = Zk —= 141 Yk4n=1 + -***+4nyk ] (8) 
para definir y„+ para k = 0. Para definir yz para k < O, utilice la relación de recurrencia 
1 1 
Yk = — Zk — — | Yk+n + 41 Yk+n-1 +t + an1 Yk+1 ] (9) 
An An 


Esto produce una señal que satisface la ecuación (7). A la inversa, cualquier señal que satis- 
face la ecuación (7) para toda k sin duda satisface las ecuaciones (8) y (9), por lo que la solu- 
ción de la ecuación (7) es única. E 


El conjunto H de todas las soluciones de la ecuación lineal homogénea en diferencias 
de n-ésimo orden 


Yin F AYk+n—1 H t + an—1Yk+1 + Anyk =O para toda k (10) 


es un espacio vectorial de dimensión n. 
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DEMOSTRACIÓN Como se indicó antes, H es un subespacio de S porque H es el nú- 
cleo de una transformación lineal. Para {yọ} en H, sea F[yx) el vector en [R" dado por 
Oo, Y1»--.> Yn—1). Es posible comprobar fácilmente que F : H > R” es una transformación 
lineal. Dado cualquier vector (yo, y1,..., yn-1) en [R”, el teorema 16 dice que hay una única 
señal (yz) en H tal que F[ yx) = Oo, Y1»--.» Yn—1). Esto significa que F es una transformación 
lineal uno a uno de H sobre R”, es decir, F es un isomorfismo. Así, dim H = dim R” = n. 
(Véase el ejercicio 32 en la sección 4.5). a 


EJEMPLO 5 Encuentre una base para el conjunto de todas las soluciones a la ecuación 
en diferencias 


Yk+3 — 2Yk+2 — 5yYk+1 + 6yk = 0 para toda k 


SOLUCIÓN Nuestro trabajo en álgebra lineal ¡realmente está rindiendo frutos ahora! Sabemos 
a partir de los ejemplos 2 y 4 que 1%, (2) y 3* son soluciones linealmente independientes. 
En general, puede ser difícil comprobar directamente que un conjunto de las señales genera el 
espacio solución. Pero eso no es problema en este caso, debido a dos importantes teoremas: 
el teorema 17, que demuestra que el espacio solución es exactamente de dimensión 3, y el 
teorema de la base de la sección 4.5, el cual afirma que un conjunto linealmente independiente 
de n vectores en un espacio de dimensión n es automáticamente una base. Así, 1%, (-2)* y 3* 
forman una base para el espacio solución. E 


La solución estándar para describir la “solución general” de la ecuación en diferencias 
(10) es mostrar una base para el subespacio de todas las soluciones. Dicha base se suele 
denominar conjunto fundamental de soluciones de (10). En la práctica, si se encuentran n 
señales linealmente independientes que satisfagan (10), de manera automática generarán el 
espacio de soluciones de dimensión n, como se explica en el ejemplo 5. 


Ecuaciones no homogéneas 
La solución general de la ecuación no homogénea en diferencias 
Yk+n + 41Yk+n—-1 H't + An—1Yk+1 + anyk = Zk para toda k (11) 


se puede escribir como una solución particular de (11) más una combinación lineal arbitraria 
de un conjunto fundamental de soluciones de la ecuación homogénea correspondiente (10). 
Este hecho es análogo al resultado de la sección 1.5 que muestra que los conjuntos solución 
de Ax = b y Ax = 0 son paralelos. Ambos resultados tienen la misma explicación: el mapeo 
X > Ax es lineal, y el mapeo que transforma la señal [y] en la señal (zz) en (11) es lineal. 
Véase el ejercicio 35. 


EJEMPLO 6 Compruebe que la señal y, = k? satisface la ecuación en diferencias 
Yk+2 — 4Yk+1 + 3yk = —4k para toda k (12) 


Luego, encuentre una descripción de todas las soluciones de esta ecuación. 
SOLUCIÓN Sustituya yz por k? en el lado izquierdo de (12): 
(k + 2)7-4(k + 1)? + 3k? 

= (k? + 4k + 4) — 4(k? + 2k + 1) + 3k? 

= —4k 
Así, k? es de hecho una solución de (12). El siguiente paso es resolver la ecuación homogénea 

Yk+2 — 4Yk+1 + 3yk = 0 (13) 

La ecuación auxiliar es 


r? —4r+3=(r-1)(r-3)=0 
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FIGURA 4 
Conjuntos solución de las 
ecuaciones en diferencias 


(12) y (13). 


Las raíces son r = 1, 3. Así que dos soluciones de la ecuación homogénea en diferencias son 
1% y 3. Evidentemente, no son múltiplos una de la otra, por lo que son señales linealmente 
independientes. De acuerdo con el teorema 17, el espacio solución es de dimensión 2, de 
manera que 3* y 1* forman una base para el conjunto de soluciones de la ecuación (13). Al 
trasladar ese conjunto mediante una solución particular de la ecuación no homogénea (12), se 
obtiene la solución general de (12): 


e A O e +3 


La figura 4 muestra una visualización geométrica de los dos conjuntos solución. Cada punto 
de la figura corresponde a una señal en $. E 


Reducción a sistemas de ecuaciones de primer orden 


Una forma moderna de estudiar una ecuación en diferencias homogénea de n-ésimo orden es 
remplazarla por un sistema equivalente de ecuaciones en diferencias de primer orden, escrito 
en la forma 


Xx+1 = AX para toda k 


donde los vectores x; están en R” y A es una matriz de n x n. 
Un ejemplo sencillo de tal ecuación en diferencias (con valor vectorial) se estudió ya en 
la sección 1.10. Otros ejemplos se tratarán en las secciones 4.9 y 5.6. 


EJEMPLO 7 Escriba la siguiente ecuación en diferencias como un sistema de primer 
orden: 


Yk+3 — 2Yk+2 — 5Yk+1 + 6yx =0 para toda k 


SOLUCIÓN Para cada k, establezca 














Yk 
Xk = | Yk+1 
Yk+2 
La ecuación en diferencias dice que Yx+3 = —6Yx + 5Yk+1 + 2Y4+2, por lo que 
Yk+1 0O + Yykyı+t0 o 1 olf 
Xk+1 = | Yk+2 | = 0 +0 + ykp |= 0 0 1 Yk+1 
EES —6yk + 5yYk+1 + 2Yk+2 A E 
Es decir, 
0 1 0 
Xx+1 = AX paratodak, donde A= 0 0 1 E 
—6 5 2 


En general, la ecuación 
Yk+n + 41Yk+n—1 + *** + an—1Yk+1 + 4nyk =0 para toda k 


se puede rescribir como Xz+¡ = AX; para toda k, donde 


0 1 o> 0 
Yk 0 0 1 0 
Yk+1 . ] : 
X; = š > = 
0 0 0 1 
Yk+n-1 
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PROBLEMA DE PRÁCTICA 


? a k k : 
Es posible demostrar que las señales 2*, 3% sen Sy 34 cos S son soluciones de 


Yk+3 — 2Yk+2 + 9yk+1 — 18yx = 0 


Demuestre que estas señales forman una base para el conjunto de todas las soluciones de la 


ecuación en diferencias. 


4.8 EJERCICIOS 


Compruebe que las señales de los ejercicios 1 y 2 son soluciones de 
la ecuación en diferencias correspondiente. 


1. 24, (45; yk+2 + 2yk+1 — 8yk = 0 
2. 5k, EN; Yi+2 25Yk =0 


Demuestre que las señales en los ejercicios 3 a 6 forman una base 
para el conjunto solución de la ecuación en diferencias correspon- 
diente. 


3. Las señales y la ecuación en el ejercicio 1 
4. Las señales y la ecuación en el ejercicio 2 
5. (EY KEY ya + AY E Y =0 
6. 4 cos (#5), 4% sen (%5); yk+2 + 16y =0 


En los ejercicios 7 a 12, suponga que las señales listadas son solucio- 
nes de la ecuación en diferencias dada. ¿Las señales forman una base 
para el espacio solución de la ecuación? Justifique sus respuestas 
usando los teoremas adecuados. 


7. 14,24, (—2)¥; yk+3 — Yk+2 — 4Yk+1 + 4yk = 0 
8. (—1)4, 2%, 3%; yk+3 — 4yk+2 + lyk+1 + 6yk = 0 
9. 2k, 5% cos (£5), 5% sen (£); 
Yk+3 — 2Yk+2 + 25yk+1 — 50yk = 0 
10. (—2)4, k(—2)4, 34; yk+3 + Yk+2 — 8Yk+1 — 12yk = 0 
11. (—1)4, 24; yk+3 — 3yYk+2 + 4yk = 0 
12. 3%, (2); yk+4 — 13yk+2 + 36y = 0 


En los ejercicios 13 a 16, encuentre una base para el espacio solución 
de la ecuación en diferencias. Demuestre que las soluciones que en- 
cuentre generan al conjunto solución. 


13. Yk42— Yri + Eyk =0 14. yayo — Sr + Óyr =0 


15. 6yk+2 + Yk+ı—2yk =0 16. yk+2—25yk = 0 


Los ejercicios 17 y 18 se refieren a un modelo sencillo de la econo- 
mía nacional descrito por la ecuación en diferencias 


Yp42 —a(1 + b)Yp41 + abY; = 1 (14) 


Aquí Y; es el ingreso nacional total durante el año k, a es una 

constante menor que 1, que se llama propensión marginal al consu- 

mo, y b es una constante de ajuste positiva que describe cómo los 
cambios en el gasto de consumo afectan la tasa anual de inversión 
privada.! 

17. Determine la solución general de la ecuación (14) cuando 
a=9yb= t ¿Qué pasa con Yp conforme k aumenta? 
[Sugerencia: En primer lugar, encuentre una solución particu- 
lar de la forma Y, = T, donde T es una constante, llamada el 
nivel de equilibrio del ingreso nacional]. 


18. Determine la solución general de la ecuación (14), cuando 
a=.9yb=.5. 


1 Por ejemplo, véase Discrete Dynamical Systems, de James T. Sandefur 
(Oxford: Clarendon Press, 1990), pp. 267-276. El modelo original acelera- 
dor-multiplicador se atribuye al economista P. A. Samuelson. 
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Una viga ligera en voladizo está soportada en los puntos N espa- 
ciados por una distancia de 10 ft, y se coloca un peso de 500 lb en 
el extremo de la viga, a 10 ft del primer soporte, como se muestra 
en la figura. Sea yz el momento flector en el k-ésimo soporte. Lue- 
go, y, = 5000 ft-Ib. Suponga que la viga está rígidamente sujeta al 
N-ésimo soporte y el momento flector ahí es cero. En medio, los 
momentos satisfacen la ecuación de tres momentos 


Yk+2 + 4yk+ı + yk =0 parak=1,2,...,N -2 (15) 








Momentos flectores en una viga en voladizo. 


19. Determine la solución general de la ecuación en diferencias 
(15). Justifique su respuesta. 


20. Encuentre la solución particular de la ecuación (15) que satisfa- 
ce las condiciones frontera y; = 5000 y yy = 0. (La respuesta 
implica a N). 


21. Cuando se produce una señal a partir de una secuencia de me- 
diciones efectuadas en un proceso (una reacción química, un 
flujo de calor a través de un tubo, un brazo robot en movi- 
miento, etcétera), la señal, por lo general, contiene ruido alea- 
torio producido por errores de medición. Un método estándar 
de procesamiento previo de los datos para reducir el ruido es 
suavizar o filtrar los datos. Un sencillo filtro es un promedio 
móvil que sustituye cada y, por su promedio con los dos valores 
adyacentes: 


tyk4i + Dyk + Iyk =Zx parak= 1l,2,... 
Suponga que una señal yz, para k = 0,..., 14, es 
9,5,7,3 24 6,376, 8,10,9, 5,7 


Utilice el filtro para calcular z1,..., z13. Trace una gráfica de 
línea discontinua que se superponga a la señal original y a la 
señal suavizada. 

22. Sea {yx} la secuencia producida por la toma de muestras de se- 
ñal continua 2 cos A + cos ue en =0, 1, 2,..., como se indica 
en la figura. Los valores de yz, empezando con k = 0, son 


3, .7,0, —.7, -3, —.7,0, .7,3, .7,0, ... 


donde .7 es una abreviatura de V/2/2. 


a) Calcule la señal de salida (z¿) cuando {yx} alimenta al filtro 
del ejemplo 3. 


b) Explique cómo y por qué la salida en el inciso a) está rela- 
cionada con los cálculos del ejemplo 3. 





Datos de la muestra de 2cos L + cos 


Los ejercicios 23 y 24 se refieren a una ecuación en diferencias de la 
forma yx+1 — 4yx = b, para constantes adecuadas a y b. 


23. Un préstamo de $10,000 tiene una tasa de interés del 1% men- 
sual y requiere un pago mensual de $450. El préstamo se realiza 
en el mes k = 0, y el primer pago se realiza un mes después, en 
k = 1. Para k = 0, 1, 2,..., sea y el saldo insoluto del préstamo 
justo después del k-ésimo pago mensual. Así, 


yı = 10,000 + (.01)10,000 — 450 
Nuevo Saldo Intereses Pago 
saldo adeudado agregados 


a) Escriba una ecuación en diferencias satisfecha por {yg}. 


b) [M] Cree una tabla que muestre k, y el saldo yz al mes k. 
Liste el programa o los tecleos (las instrucciones) para crear 
la tabla. 


c) [M] ¿Cuál es el valor de k cuando se efectúa el último pago? 
¿De cuánto será el último pago? ¿Cuánto dinero en total 
pagó el deudor? 


24. En el tiempo k = 0, con una inversión inicial de $1000 se abre 
una cuenta de ahorros que paga el 6% de interés anual con ca- 
pitalización mensual. (La tasa de interés mensual es de .005). 
Cada mes después de la inversión inicial, se agregan $200 a la 
cuenta. Para k = 0, 1, 2,..., sea yz la cantidad que hay en la cuen- 
ta al momento k, justo después de que se hace un depósito. 


a) Escriba una ecuación en diferencias que satisfaga (yx). 


b) [M] Cree una tabla que muestre k, y la cantidad total en la 
cuenta de ahorros en el mes k, para k = 0 a 60. Liste su pro- 
grama o los tecleos (las instrucciones) que utilizó para crear 
la tabla. 


c) [M] ¿Cuánto habrá en la cuenta después de dos años (es de- 
cir, 24 meses), cuatro años, y cinco años? ¿Qué parte del 
total a los cinco años corresponderá a los intereses? 


En los ejercicios 25 a 28, demuestre que la señal dada es una solu- 
ción de la ecuación en diferencias. Luego, determine la solución ge- 
neral de esa ecuación en diferencias. 


25. yk = k’; yk+2 + 3Yk+1ı — 4yk = 7 + 10k 
26. yk =1+k; Yk42— 6yk+1 + 5yr = —4 
27. yk =k-2; yk+2—4yk = 8 — 3k 

28. yk 


1+ 2k; yk+2 — 25yk = —48k — 20 


Escriba las ecuaciones en diferencias en los ejercicios 29 y 30 como 
sistemas de primer orden, X+1 = AX, para toda k. 


29. 
30. 
31. 


32. 


33. 


34. 


4.9 | APLICACIONES A CADENAS DE MARKOV 


Yk+4 + 3Yk+3 — 8 Y +2 + OY 41 — 2yk = 0 
Yk+3 — 5yYk+2 + 8yk = 0 


¿La siguiente ecuación en diferencias es de orden 3? Explique 
su respuesta. 


Yk+3 + 5Yk+2 + OYyk+ı = 0 


¿Cuál es el orden de la siguiente ecuación en diferencias? Expli- 
que su respuesta. 


Yk+3 + 41 Yk+2 + A2Yk+1 + a3yk = 0 


Sea yk = k? y zk = 2k| k|. ¿Las señales {yz} y {zx} son lineal- 
mente independientes? Evalúe la matriz de Casorati C(k) aso- 
ciada para k = 0, k = —1 y k = —2, y analice sus resultados. 


Sean f, g y h, funciones linealmente independientes definidas 
para todos los números reales, y construya tres señales por mues- 
treo de los valores de las funciones de los números enteros: 


uk = f(k)  v=g(k), w =h(k) 


35. 


36. 


37. 
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¿Es necesario que las señales sean linealmente independientes 
en S? Analícelo. 


Sean a y b números diferentes de cero. Demuestre que el mapeo 
T definido por T([ yx) = [wx), donde 

Wk = Yk+2 + AYyk+ı + byk 

es una transformación lineal de S en S. 

Sea V un espacio vectorial, y sea T : V — V una transformación 
lineal. Dada z en V, suponga que x, en V satisface T(X,) = Z, 


y sea u cualquier vector en el núcleo de T. Demuestre que 
u + x, satisface la ecuación no homogénea T(x) = z. 


Sea Sy el espacio vectorial de todas las secuencias de la forma 
Oo, Y1> Y2.. -), y defina las transformaciones lineales T y D de Sọ 
dentro de Sy por 


T (yo, Y1; Y2,- --) = (Y1, Y2, Y3,- --) 
D(yo, y1, Y2,- -) = (0, Yo, Y1, Y2,---) 


Demuestre que TD = 7 (la transformación identidad en Sọ) y 
que, sin embargo, DT 4 I. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Examine la matriz de Casorati: 


C(k) = 











k k kr k kr 

2 3 sen 5 3 cos $ 
k+1 k+1 (k+Dr k+1 (k+1)x 
2 3 sen == 3 cos == 
2k 2 3k 2 sen a 3k+2 cos Croz 











Sea k = 0 y reduzca por filas la matriz para comprobar que tiene tres posiciones pivote y que, 


por lo tanto, es invertible: 


1 
c()=| 2 
4 


o 1 1 0 1 
3 0|=|0 3 -2 
0 —9 0 0 -13 


La matriz de Casorati es invertible en k = 0, por lo que las señales son linealmente inde- 
pendientes. Puesto que hay tres señales, y el espacio solución H de la ecuación en diferencias 
es de dimensión 3 (teorema 17), las señales forman una base para H, de acuerdo con el teo- 


rema de la base. 


Las cadenas de Markov descritas en esta sección se utilizan como modelos matemáticos de 
una amplia variedad de situaciones en biología, negocios, química, ingeniería, física y otros 
campos. En cada caso, el modelo se utiliza para describir un experimento o una medición 
que se realiza muchas veces de la misma manera, cuando el resultado de cada ensayo del 
experimento será uno de varios posibles resultados especificados, y depende solo del ensayo 


inmediato anterior. 


Por ejemplo, si la población de una ciudad y sus suburbios se midieran cada año, enton- 


ces un vector tal como 


(1) 


e-l 


.60 
.40 
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podría indicar que el 60% de la población vive en la ciudad y el 40% en los suburbios. 
Los decimales en xy suman 1, ya que dan cuenta de toda la población de la región. Los por- 
centajes son más convenientes para nuestros propósitos en este momento que los totales de 
población. 

Un vector con entradas no negativas que suman 1 se llama vector de probabilidad. 
Una matriz estocástica es una matriz cuadrada cuyas columnas son vectores de probabili- 
dad. Una cadena de Markov es una secuencia de vectores de probabilidad de Xp, X1, X>,..., 
junto con una matriz estocástica P, tal que 


X; 5 PXo, X: 5 PX; y M3 — Px,, 
Así, la cadena de Markov se describe mediante la ecuación en diferencias de primer orden 
Xr+1 = PX; parak=0,1,2,... 


Cuando una cadena de Markov de vectores en R” describe un sistema o una serie de 
experimentos, las entradas en x listan, respectivamente, las probabilidades de que el sistema 
esté en cada uno de los n posibles estados, o las probabilidades de que el resultado del expe- 
rimento sea uno de los n posibles resultados. Por esta razón, xz con frecuencia se llama un 
vector de estado. 


EJEMPLO 1 En la sección 1.10 se examinó un modelo para los movimientos de pobla- 
ción entre una ciudad y sus suburbios. Véase la figura 1. La migración anual entre estas dos 
partes de la zona metropolitana se regía por la matriz de migración M: 


De: 
Ciudad Suburbios De: 


M= .95  .03 Ciudad 
1.05  .97 Suburbios 


Es decir, cada año el 5% de la población de la ciudad se muda a los suburbios, y el 3% de la 
población de los suburbios se muda a la ciudad. Las columnas de M son vectores de probabili- 
dad, por lo que M es una matriz estocástica. Suponga la población de la región en el año 2000 
era de 600,000 en la ciudad y de 400,000 en los suburbios. Entonces, la distribución inicial de 
la población en la región está dada por xy en la ecuación (1) anterior. ¿Cuál es la distribución 
de la población en el año 2001? ¿Y en 2002? 


95 





FIGURA 1 Migración porcentual anual entre la ciudad y los suburbios. 


SOLUCIÓN En el ejemplo 3 de la sección 1.10, vimos que después de un año, el vector de 


600,000 


y cambió a 


.95  .03 || 600,000 | _ | 582,000 
.05 .97 || 400,000 | | 418,000 


población | 
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Si dividimos ambos lados de esta ecuación entre la población total de un millón y considera- 
mos el hecho de que kMx = M(kx), se encuentra que 


.95 .03||.600 | _ | .582 
05 .97 || .400 | | .418 


zi da la distribución de la población en 2001. Es decir, el 58.2% de la 


.418 
región vivía en la ciudad y el 41.8% vivía en los suburbios. Del mismo modo, la distribución 
de la población en el año 2002 se describe por un vector x2, donde 


95 .037[.582] _ [ .565 
1 =Mx=| ETE z 


EJEMPLO 2 Suponga que el resultado de la votación durante las elecciones de un con- 
greso en un distrito de votación está representado por un vector x en R3: 


El vector Xi = | 


% de votación por los demócratas (D) 
x = | % de votación por los republicanos (R) 
% de votación por los liberales (L) 


Suponga que se registra el resultado de las elecciones al congreso cada dos años mediante 
un vector de este tipo y que el resultado de una elección solo depende de los resultados de 
la elección anterior. Entonces, la secuencia de los vectores que describen los votos cada dos 
años puede ser una cadena de Markov. Como un ejemplo de una matriz estocástica P para 
esta cadena, tomamos 


De: 
D R L A: 
.70 .10 .30 D 
P=|.20 .80 .30 R 
.10 .10 .40 L 


Las entradas en la primera columna, denotada como D, describen qué van a hacer en las 
próximas elecciones las personas que votaron por los demócratas en una elección. Aquí su- 
pusimos que el 70% votará de nuevo por los demócratas en las próximas elecciones, el 20% 
votará por los republicanos, y el 10% dará su voto a los liberales. Similares interpretaciones 
valen para las otras columnas de P. Un diagrama de esta matriz se presenta en la figura 2. 


70 -80 


WE Votación por Votación por a 
demócratas 


.20 
O republicanos 
.30 











Votación por 
liberales 


.40 


FIGURA 2 Cambios en la votación de una elección 
a la siguiente. 
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Si los porcentajes de “transición” se mantienen constantes a lo largo de muchos años 
de una elección a otra, entonces la secuencia de los vectores que dan los resultados de la 
votación constituye una cadena de Markov. Suponga que el resultado de una elección está 
dado por 


.05 


Determine el resultado probable de la siguiente elección y el resultado probable de la elección 
posterior. 


SOLUCIÓN El resultado de la siguiente elección se describe mediante el vector de estado x; 
y el de la elección posterior por x2, donde 


70 .10 .30 .55 .440 El 44% votará por D 
xı = Px = | .20 .80 .30 .40 | = | .445 El 44.5% votará por R 
.10 .10 .40 .05 .115 El 11.5% votará por L 
.70 .10 .30 .440 .3870 El 38.7% votará por D 
x, = Px; = | .20 .80 .30 445 | =| .4785 El 47.8% votará por R 
.10 .10  .40 .115 .1345 El 13.5% votará por L 


Para entender por qué xı, efectivamente, da el resultado de las próximas elecciones, su- 
ponga que 1000 personas votaron en la “primera” elección, con 550 votos a favor de D, 400 
votos a favor de R y 50 votos a favor de L. (Véase los porcentajes en xp). En la siguiente 
elección, el 70% de los 550 votarán de nuevo por D, el 10% de los 400 cambiará su voto de 
R a D, y el 30% de los 50 cambiará de L a D. De esta forma, el total de votos para D será 


.70(550) + .10(400) + .30(50) = 385 + 40 + 15 = 440 2) 


Así, el 44% de la próxima votación será a favor del candidato demócrata. El cálculo en (2) 
es, en esencia, el mismo que se utilizó para calcular la primera entrada en x¡. Se podrían 
hacer cálculos análogos para las otras entradas en x¡, para las entradas en Xx», y así suce- 
sivamente. E 


Predicciones del futuro lejano 


El aspecto más interesante de las cadenas de Markov es el estudio del comportamiento a largo 
plazo de una cadena. Por ejemplo, ¿qué se puede decir en el ejemplo 2 de la votación después 
de que han pasado muchas elecciones (suponiendo que la matriz estocástica dada continúe 
describiendo los porcentajes de transición de una elección a la siguiente)? O, ¿qué sucede 
con la distribución de la población en el ejemplo 1 “a largo plazo”? Antes de responder estas 
preguntas, veamos un ejemplo numérico. 


T 2 a 1 
EJEMPLO 3 SeaP=|.3 .8 .3 |yxo=|0 |. Considere un sistema cuyo estado 
2 0 4 0 


está descrito por la cadena de Markov Xz+1 = Pxz, para k = 0, 1,... ¿Qué sucede con el 
sistema a medida que transcurre el tiempo? Para averiguarlo, calcule los vectores de es- 
tado de X;,..., X15. 
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SOLUCIÓN 
5.2 3 1 5 
X; = PXxo = 3 8 3 0 — 3 
2 0 4]|j0 2 
5. 2 3]|.5 37 
x= Px=|.3 8 .31|.3|=]|.45 
2 0 4]||.2 .18 
5 2 31.37 329 
x = Px =|.3 .8 .31]||.45|=]| .525 
2 0 .4]||.18 .146 


Los resultados de los cálculos posteriores se muestran a continuación, con las entradas redon- 
deadas a cuatro o cinco cifras significativas. 


.3133 .3064 .3032 .3016 

x4 = | .5625 |, x5=| .5813 |, X6 = | .5906 |, x7 = | .5953 
.1242 .1123 .1062 .1031 
-3008 .3004 .3002 .3001 

Xs = | .5977 |, Xo = | .5988 |, Xo = | -5994 |, X = | .5997 
.1016 .1008 .1004 .1002 
.30005 .30002 .30001 .30001 

X12 = | .59985 |, X3 = | .59993 |, xi4= | .59996 |, x¡5= | .59998 
.10010 .10005 .10002 .10001 

:3 
Estos vectores parecen acercarse a q = | .6 |. Las probabilidades son difíciles de cambiar 


de un valor de k al siguiente. Observe que el siguiente cálculo es exacto (sin errores de 
redondeo): 


e 0 A 3 .15+.12 + .03 30 
Pq=|3 8 3 6 | = | .09 + .48 + .03 | = | .60 | =q 
Z EJLA 06+ 0 +.04 19 


Cuando el sistema está en estado q, no hay ningún cambio en el sistema de una medición a 
la siguiente. E 


Vectores de estado estable 


Si P es una matriz estocástica, entonces un vector de estado estable (o vector de equilibrio) 
de P es un vector de probabilidad q tal que 


Pq=4q 


Es posible demostrar que toda matriz estocástica tiene un vector de estado estable. En el 
ejemplo 3, q es un vector de estado estable de P. 


EJEMPLO 4 El vector de probabilidad q = | a] es un vector de estado estable para 


la matriz de migración de población M en el ejemplo 1, porque 


ma=[:95  .037[.3757 _ [ .35625+.01875] _ [ 375] _ i 
4= | 05 97 || 625 | 7 | 01875 + .60625 | 7 | .625| 749 
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Si el total de la población de la región metropolitana en el ejemplo 1 es de 1 millón, en- 
tonces q del ejemplo 4 correspondería a tener 375,000 personas en la ciudad y 625,000 en los 
suburbios. Al final de un año, la emigración de la ciudad sería (.051(375,000) = 18,750 perso- 
nas, y la inmigración a la ciudad proveniente de los suburbios sería (.03)(625,000) = 18,750 
personas. Como resultado, la población de la ciudad seguiría siendo la misma. Asimismo, la 
población de los suburbios se mantendría estable. 

El siguiente ejemplo muestra cómo encontrar un vector de estado estable. 


6 


EJEMPLO 5 Sea P = | 4 


.3 
7 | Encuentre un vector de estado estable para P. 


SOLUCIÓN En primer lugar, se resuelve la ecuación Px = x. 


Px-x=0 
Px—-Ix=0 Recuerde de la sección 1.4 que Ix = x. 
(P-Dx=0 


Para la P anterior, 


6 3 1 0 =4 3 
Ptej} l-ie al 4 f 
Para encontrar todas las soluciones de (P — I)x = 0, se reduce por filas la matriz aumentada: 
—.4 3 0 z —.4 3 0 a 1 —3/4 0 
4-3 0 0o 0 0 0 0 0 
3 . so 3/4 
Entonces xı = 7X2 y %2 e8 libre. La solución general es x2 Ll 


A continuación, se elige una base sencilla para el espacio solución. Una elección evi- 


3/4 a PIO ai i 3 ; 
dente es 1 | Pero una mejor opción, sin fracciones, es W = 4 (correspondiente 


a= 4). 

Por último, encuentre un vector de probabilidad en el conjunto de todas las soluciones de 
Px = x. Este proceso es fácil, ya que cada solución es un múltiplo de la solución w anterior. 
Divida w entre la suma de sus entradas para obtener 


E 


Para comprobar, calcule 


pa [6/10 3/107[3/7] _ [18/70+12/70] _ [30/70] _ Š 
4= ano 7/10 || 4/7 | 7 | 12/70 + 28/70 | 7 | 40/70 |7 9 


El siguiente teorema demuestra que lo que sucedió en el ejemplo 3 es característico de 
muchas matrices estocásticas. Decimos que una matriz estocástica es regular si alguna poten- 
cia de la matriz P* contiene solo entradas estrictamente positivas. Para P en el ejemplo 3, 


37 26 33 
P?= | 45 .70 .45 
18 .04 .22 


Ya que cada entrada en P? es estrictamente positiva, P es una matriz estocástica regular. 

Además, se dice que una secuencia de vectores [xz: k = 1, 2,...] converge a un vector 
q conforme k > % si las entradas en x, se pueden acercar tanto como se desee a las entradas 
correspondientes en q al hacer a k suficientemente grande. 
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TEOREMA 18 Si P es una matriz de n X n estocástica regular, entonces P tiene un único vector 
de estado estable q. Además, si xy es cualquier estado inicial y una Xķ+ı = PX% para 
k=0, 1, 2,..., entonces la cadena de Markov (x¿) converge a q conforme k > oo, 


Este teorema se demuestra en los libros que analizan cadenas de Markov. La parte sor- 
prendente del teorema es que el estado inicial no tiene ningún efecto sobre el comportamiento 
a largo plazo de la cadena de Markov. Se verá más adelante (en la sección 5.2) por qué esto es 
cierto para varias matrices estocásticas estudiadas aquí. 


EJEMPLO 6 En el ejemplo 2, ¿qué porcentaje de los electores tienden a votar por el 
candidato republicano en alguna elección muchos años después a partir de ahora, suponiendo 
que el resultado de las elecciones forman una cadena de Markov? 


SOLUCIÓN Para los cálculos a mano, el enfoque equivocado es elegir algún vector inicial 
Xy y calcular X;,..., Xx, para algún valor grande de k. No hay manera de saber cuántos vectores 
habrá que calcular, y no se puede estar seguro de los valores límite de las entradas en xz. 

El enfoque correcto es calcular el vector de estado estable y, luego, recurrir al teorema 
18. Dado P como en el ejemplo 2, se forma P — I restando 1 de cada entrada diagonal en P. 
Después se reduce por filas la matriz aumentada: 


-3 1 3 0 
[(P-I) 0ļ=| 2-2 3 0 
1 1—6 0 


Recuerde, de trabajos anteriores con decimales, que el cálculo se simplifica al multiplicar 
cada fila por 10.! 


-3 1 3 0 1 0 -94 0 
2—2 Be lalo 1 —=15/⁄4 0 
1 1—6 0 0o o0 0o o0 


La solución general de (P — Dx = 0 es xı = 3X3, X = Dya y x3 es libre. Eligiendo x3 = 4, 
se obtiene una base para el espacio solución cuyas entradas son enteros, y a partir de ello se 
encuentra fácilmente el vector de estado estable cuyas entradas suman 1: 


9 9/28 .32 
w=]|15| y q= | 15/28 | = | .54 
4 4/28 .14 


Las entradas en q describen la distribución de los votos en una elección que se celebrará den- 
tro de muchos años (suponiendo que la matriz estocástica continúa describiendo los cambios 
de una elección a otra). Así, finalmente, alrededor del 54% de los votos serán para el candida- 
to republicano. E 


1 Advertencia: No solo multiplique P por 10. En vez de ello, multiplique la matriz aumentada para la ecuación 
(P — Dx =0 por 10. 
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4.9 EJERCICIOS 


1. Un pueblo remoto y pequeño recibe transmisiones de radio 





NOTA NUMÉRICA 

Quizás haya notado que si X¿+1 = Px para k = 0, 1,... entonces 
x = Px; = P(Pxo) = P?Xo, 

y, en general, 


x; = P*xy parak = 0, 1,... 


Para calcular un vector específico, tal como x3, se necesitan menos operaciones arit- 
méticas para calcular x1, X2 y X3, más que P? y P°xọ. Sin embargo, si P es pequeña, 
por ejemplo, 30 x 30, el tiempo de cálculo de la máquina es insignificante con am- 
bos métodos, y tal vez se prefiera un comando para calcular P°xọ, ya que requiere 
teclear menos. 


PROBLEMAS DE PRÁCTICA 


1. 


Suponga que los habitantes de una región metropolitana se desplazan de acuerdo con las 
probabilidades de la matriz de migración M del ejemplo 1, y que se elige un residente “al 
azar”. Entonces, un vector de estado para un año determinado se puede interpretar como 
un indicador de las probabilidades de que la persona sea residente de la ciudad o de los 
suburbios en ese momento. 


a) Suponga que la persona elegida es un residente de la ciudad ahora, de manera que 
Xo = | al ¿Cuál es la probabilidad de que esa persona viva en los suburbios el 


año próximo? 


b) ¿Cuál es la probabilidad de que esa persona viva en los suburbios en dos años? 
6 2 :3 
Sea P = 4 8 |Y94=|3| ¿Es q un vector de estado estable para P? 


¿Qué porcentaje de la población en el ejemplo 1 vivirá en los suburbios después de mu- 
chos años? 


mento en el siguiente ensayo con una probabilidad del 60%, y 


de dos estaciones radiofónicas: una de noticias y una emisora de 
música. De los oyentes que sintonizan la emisora de noticias, el 
70% seguirá escuchando las noticias después del corte de esta- 
ción que ocurre cada media hora, mientras que el 30% sintoni- 
zará la estación de música durante el corte de estación. De los 
oyentes que sintonizan la estación de música, el 60% cambiará 
a la estación de noticias en el corte de estación, mientras que el 
40% permanecerá escuchando la música. Suponga que todos los 
habitantes están escuchando las noticias a las 8:15 A.M. 


a) Dé la matriz estocástica que describe cómo los oyentes de 
radio tienden a cambiar las estaciones en cada corte de esta- 
ción. Rotule las filas y las columnas. 


b) Dé el vector de estado inicial. 


c) ¿Qué porcentaje de los oyentes estará escuchando la emi- 
sora de música a las 9:25 A.M. (después de los cortes de esta- 
ción de las 8:30 y de las 9:00 A.m.)? 


. Un animal de laboratorio puede comer cualquiera de tres ali- 


mentos cada día. Los registros de laboratorio indican que si el 
animal elige un alimento en un ensayo, elegirá el mismo ali- 


elegirá cualquiera de los otros alimentos en el siguiente ensayo 
con iguales probabilidades del 20%. 


a) ¿Cuál es la matriz estocástica de esta situación? 


b) Si el animal elige el alimento +1 en un ensayo inicial, ¿cuál 
es la probabilidad de que elija el alimento +2 en el segundo 
ensayo después del inicial? 






m 


J 


3. En un día cualquiera, un estudiante está sano o enfermo. De los 


estudiantes que están sanos hoy, el 95% estarán sanos mañana. 


De los estudiantes que están enfermos hoy, el 55% seguirán en- 
fermos mañana. 


a) ¿Cuál es la matriz estocástica de esta situación? 


b) Suponga que el 20% de los alumnos están enfermos el lunes. 
¿Qué fracción o porcentaje de los estudiantes es probable 
que estén enfermos el martes? ¿Y el miércoles? 


c) Si un estudiante está sano hoy, ¿cuál es la probabilidad de 
que esté sano dentro de dos días? 


El clima en Columbus es bueno, regular o malo en un día deter- 
minado. Si el clima es bueno hoy, hay un 40% de probabilidad 
de que sea bueno mañana, un 30% de probabilidad de que sea 
regular, y un 30% de que sea malo. Si el clima es regular hoy, 
existe un 50% de probabilidad de que sea bueno mañana, y un 
20% de probabilidad de que sea regular. Por último, si el clima 
es malo hoy, existe un 30% de probabilidad de que sea bueno 
mañana y un 40% de que sea regular. 


a) ¿Cuál es la matriz estocástica de esta situación? 


b) Suponga que hay una probabilidad del 50% de buen clima 
hoy, y una probabilidad del 50% de clima regular. ¿Cuáles 
son las probabilidades de que el clima sea malo mañana? 


c) Suponga que, de acuerdo con los pronósticos para el lunes, 
hay un 60% de probabilidad de que el clima sea regular y 
un 40% de que sea malo. ¿Cuáles son las probabilidades de 
tener buen clima el miércoles? 


En los ejercicios 5 a 8, encuentre el vector de estado estable. 


10. 


11. 


12. 


13. 


14. 


15. 


ee] 


ae ake -aA 4 5.8 
LD E 8. 0 5 l 
Le 7 6 0 .l 


SPN 2d ; Jk 
Determine si P = g ọoļeswma matriz estocástica regular. 


1 


Determine si P = | 0 


3 ] E 

7 | es una matriz estocástica regular. 
a) Encuentre el vector de estado estable para la cadena de 
Markov en el ejercicio 1. 


b) En algún momento al final del día, ¿qué fracción de los 
oyentes escuchará las noticias? 


Consulte el ejercicio 2. ¿Qué alimento prefiere el animal des- 
pués de muchos ensayos? 


a) Encuentre el vector de estado estable para la cadena de 
Markov en el ejercicio 3. 


b) ¿Cuál es la probabilidad de que, después de muchos días, un 
estudiante en particular esté enfermo? ¿Importa si esa perso- 
na está enferma hoy? 


Consulte el ejercicio 4. En el largo plazo, ¿qué tan probable es 
que el clima en Columbus sea bueno en un día determinado? 


[M] La Unidad de Investigación Demográfica del Departamento 
de Finanzas del Estado de California proporcionó los siguientes 
datos para la matriz de migración, la cual describe el movimien- 
to de la población de Estados Unidos durante 1989. En ese año, 


16. 


17. 


18. 


19. 


20. 
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alrededor del 11.7% de la población total vivía en California. 
¿Qué porcentaje de la población total con el tiempo vivirá en 
California si las probabilidades de migración mencionadas se 
mantuvieran constantes durante muchos años? 


De: 
CA Resto de E.U.A. A: 
.9821 .0029 California 
hee ai Resto de E.U.A. 


[M] En Detroit, Hertz Rent A Car cuenta con una flota de 
cerca de 2000 automóviles. El patrón de puntos de alquiler 
y devolución de las unidades está descrito por las fracciones 
en la siguiente tabla. En un día típico, ¿cuántos autos estarán 
listos para rentarse en la sucursal ubicada en el centro de la 
ciudad? 


Autos rentados en: 
Aeropuerto Apto. fuera 


de la cd. Centro de cd. Devueltos en: 
.90 .01 .09 Aeropuerto de la cd. 
.01 .90 .01 Centro 
.09 .09 .90 Apto. fuera de cd. 


Sea P una matriz estocástica de n x n. El siguiente argumento 
indica que la ecuación Px = x tiene una solución no trivial. (De 
hecho, una solución de estado estable existe con entradas no 
negativas. En algunos libros de texto avanzados se da una de- 
mostración). Justifique cada una de las siguientes afirmaciones. 
(Mencione un teorema cuando sea pertinente). 


a) Si todas las otras filas de P — I se suman a la fila de abajo, 
el resultado es una fila de ceros. 


b) Las filas de P — I son linealmente dependientes. 
c) La dimensión del espacio fila de P — I es menor que n. 


d) P — I tiene un espacio nulo no trivial. 


Demuestre que toda matriz estocástica de 2 x 2 tiene al menos 
un vector de estado estable. Cualquier matriz de este tipo se 


l-a B 

Q 1-É8 
æ y B son constantes entre O y 1. (Hay dos vectores de estado 
estable, linealmente independientes, si œ = 6 = 0. De lo con- 
trario, solo hay uno). 


puede representar en la forma P = | | donde 


Sea S una matriz fila de 1 x n con un 1 en cada columna, 

S=[1 1- 1] 

a) Explique por qué un vector x en R” es un vector de proba- 
bilidad si y solo si sus entradas son no negativas y Sx = 1. 
(Una matriz de 1 x 1 como el producto Sx generalmente se 
representa sin los símbolos de corchete de la matriz). 


b) Sea P una matriz estocástica de n x n. Explique por qué 
SP = S. 
c) Sea P una matriz estocástica de n x n, y sea x un vector 


de probabilidad. Demuestre que Px es también un vector de 
probabilidad. 


Con base en el ejercicio 19, demuestre que si P es una matriz 
estocástica de n x n, entonces también lo es P?. 
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21. [M] Examine las potencias de una matriz estocástica regular. 
a) Calcule P* para k = 2, 3, 4, 5, cuando 


Haga una conjetura sobre lo que podría ser cierto para cual- 
quier matriz estocástica regular. 


c) Con base en el teorema 18, explique lo que encontró en los 


.3355  .3682  .3067  .0389 incisos a) y b). 
.2663 .2723 .3277  .5451 

P= 11935 .1502 .1589 .2395 22. [M] Compare dos métodos para encontrar el vector de estado 
2047 .2093 .2067 .1765 estable q de una matriz estocástica regular P: 1. calculando q 


Presente los cálculos con cuatro decimales. ¿Qué ocurre a 
las columnas de P* conforme k aumenta? Calcule el vector 


de estado estable para P. 


b) Calcule O* para k = 10, 20,..., 80, cuando 


97 05 .10 
O=| 0 .% 05 
.03 05  .85 


(La estabilidad de O* con cuatro decimales puede requerir 
k = 116 o más). Calcule el vector de estado estable para Q. 


como en el ejemplo 5, o 2. calculando P* para un valor grande 
de k y utilizando una de las columnas de P* como una aproxima- 
ción para q. [La Guía de estudio describe un programa de base 
nula que casi automatiza el método 1]. 

Experimente con las matrices aleatorias estocásticas más gran- 
des que su programa de matrices le permita, y utilice k = 100 o 
algún otro valor grande. Para cada método, describa el tiempo 
que usted necesita para teclear y ejecutar su programa. (Algu- 
nas versiones de MATLAB tienen los comandos flops y tic 
...Eoc que registran el número de operaciones de punto flotante 
y el tiempo total transcurrido que utiliza MATLAB). Compare las 
ventajas de cada método y determine cuál prefiere. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. a) Como el 5% de los residentes de la ciudad se mudará a los suburbios en menos de 


b) 


un año, hay una probabilidad del 5% de elegir a esa persona. Sin profundizar en el 
conocimiento acerca del individuo, se dice que hay un 5% de probabilidad de que este 
se mude a los suburbios. Este hecho se encuentra en la segunda entrada del vector de 


estado x¡, donde 
1 — 
o|= 


La probabilidad de que la persona viva en los suburbios después de dos años es del 
9.6%, porque 


.95 
.05 


.03 
.97 


.95 


x= Mxo= | 05 


E 95 .03||.95| _ | -904 
x= Ma E| o5 97 || .05 |7 | .096 
2. El vector de estado estable satisface Px = x. Como 
6 .2||.3 .32 
PS E a E iA 74 
llegamos a la conclusión de que q no es el vector de estado estable para P. 
3. M en el ejemplo 1 es una matriz estocástica regular, ya que sus entradas son estricta- 


mente positivas. Así que podemos utilizar el teorema 18. Ya conocemos el vector de es- 
tado estable del ejemplo 4. Por lo tanto, los vectores de distribución de la población xz 
convergen en 


373 
.625 


a Ls] 


Al final, el 62.5% de la población vivirá en los suburbios. 
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1. Marque cada enunciado como verdadero o falso. Justifique sus 


incisos a) a f), V1,..., Y) SON vectores en un espacio vectorial V 


respuestas. (Si es verdadero, cite hechos o teoremas pertinentes. 
Si es falso, explique por qué o dé un contraejemplo que muestre 
por qué el enunciado no es cierto en todos los casos). En los 


con dimensión finita diferente de cero, y $ = [vj,..., Vp). 


a) El conjunto de todas las combinaciones lineales de v1,..., Vp 
es un espacio vectorial. 


b) Si [v1,..., Vp-1) genera a V, entonces S$ genera a V. 

c) Si [v1,..., Vp-1) es linealmente independiente, también S lo es. 

d) Si S es linealmente independiente, entonces S es una base 
para V. 

e) Si Gen S = V, entonces algún subconjunto de $ es una 
base para V. 

f) Sidim V = p y Gen S = V, entonces S no puede ser lineal- 
mente dependiente. 

g) Un plano en R? es un subespacio de dimensión 2. 

h) Las columnas de una matriz que no son pivote siempre son 
linealmente dependientes. 

i) Las operaciones de fila en una matriz A pueden cambiar las 
relaciones de dependencia lineal entre las filas de A. 

j) Las operaciones de fila en una matriz pueden cambiar el es- 
pacio nulo. 

k) El rango de una matriz es igual al número de filas diferentes 
de cero. 

1) Siuna matriz A de m x n es equivalente por filas a una matriz 
escalonada U, y si U tiene k filas diferentes de cero, entonces 
la dimensión del espacio solución de Ax = O es m — k. 

m) Si B se obtiene a partir de una matriz A con varias operacio- 
nes elementales de fila, entonces rango B = rango A. 

n) Las filas diferentes de cero de una matriz A forman una base 
para Fila A. 

o) Si las matrices A y B tienen la misma forma escalonada re- 
ducida, entonces Fila A = Fila B. 

p) Si H es un subespacio de RÌ, entonces hay una matriz A de 
3 x 3 tal que H = Col A. 

q) Si A esm x n y rango A = m, entonces la transformación 
lineal x > Ax es uno a uno. 

r) SiA es dem x n y la transformación lineal x > Ax es sobre, 
entonces rango A = m. 

s) Una matriz de cambio de coordenadas siempre es invertible. 

1) Sib = {b1,..., bn} y C = {€1,..., Cn} son bases para un es- 
pacio vectorial V, entonces la j-ésima columna de la matriz 
de cambio de coordenadas de la matriz z Pa es el vector de 
coordenadas [c;] y. 

. Encuentre una base para el conjunto de todos los vectores de la 

forma 


a=—2b + 5c 
2a + 5b — 8c i 
-a-4b+7e | (Tenga cuidado). 
3a+b+ce 
=a 1 b, 
. Sean u = 4|, w= 2l, bel bs ; 
=6 5 


W = Gen {u;, u2}. Encuentre una descripción implícita de W, 
es decir, encuentre un conjunto de una o más ecuaciones homo- 
géneas que caracterizan a los puntos de W. [Sugerencia: Pre- 
gúntese cuándo está b en W]. 


. Explique lo que está mal en el siguiente análisis: Sea f(t) = 3 + 
t y g(t) = 3t + t?, y note que g(t) = tf(t). Entonces, {f, g} es 
linealmente dependiente, porque g es un múltiplo de f. 

. Considere los polinomios pı( = 1 + t, p = 1 - t, pÀ = 
4, palt) = t + Ê, y ps(f) = 1 +21 + É, y sea H el subespacio 
de [Ps generado por el conjunto S = (pi, p», pz, Pa, Ps). Utilice 


10. 


11. 
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el método descrito en la demostración del teorema del conjunto 
generador (sección 4.3) con la finalidad de obtener una base para 
H. (Explique cómo seleccionar los miembros adecuados de $). 


Suponga que p1, P2, p3, p4 son polinomios específicos que ge- 
neran un subespacio H de dimensión 2 de P5. Describa cómo 
se puede encontrar una base para H mediante el examen de los 
cuatro polinomios y sin hacer casi ningún cálculo. 


¿Qué tendría que saber acerca del conjunto solución de un siste- 
ma homogéneo de 18 ecuaciones lineales con 20 variables con 
la finalidad de determinar que cada ecuación no homogénea 
asociada tiene una solución? Analice. 


Sea H un subespacio de dimensión n de un espacio vectorial V 
de dimensión n. Explique por qué H = V. 


Sea T : R" > R” una transformación lineal. 


a) ¿Cuál es la dimensión del rango de T si T es un mapeo uno a 
uno? Explique su respuesta. 


b) ¿Cuál es la dimensión del núcleo de T (véase la sección 4.2) 
si T mapea R” sobre R”? Explique su respuesta. 


Sea S un subconjunto maximal linealmente independiente de un 
espacio vectorial V. Es decir, S tiene la propiedad de que si 
un vector que no está en S se adjunta a S, entonces el nuevo con- 
junto ya no será linealmente independiente. Demuestre que S 
debe ser una base para V. [Sugerencia: Pregúntese qué pasa si 
S es linealmente independiente, pero no una base de V]. 


Sea S un conjunto generador mínimo finito de un espacio vecto- 
rial V. Es decir, S tiene la propiedad de que si un vector se elimi- 
na de S, entonces el nuevo conjunto ya no genera a V. Demuestre 
que S debe ser una base para V. 


Los ejercicios 12 a 17 desarrollan las propiedades del rango que a 
veces son necesarias en las aplicaciones. Suponga que la matriz A 
es de m x n. 


12. 


13. 


14. 


15. 


16. 


A partir de los incisos a) y b) demuestre que el rango AB no 
puede exceder al rango de A o al rango de B. (En general, el 
rango de un producto de matrices no puede exceder el rango 
de cualquier otro factor en el producto). 


a) Demuestre que si B es de n x p, entonces rango AB < ran- 
go A. [Sugerencia: Explique por qué cada vector en el es- 
pacio columna de AB está en el espacio columna de A]. 


b) Demuestre que si B es n x p, entonces rango AB < 
rango B. [Sugerencia: Tome en cuenta el inciso a) para 
estudiar el rango de (AB)”]. 


Demuestre que si P es una matriz invertible de m x m, entonces 
el rango PA = rango A. [Sugerencia: Aplique el ejercicio 12 
a PA y P~ !(PA)]. 


Demuestre que si Q es invertible, entonces rango AQ = ran- 
go A. [Sugerencia: Tome en cuenta el ejercicio 13 para estu- 
diar el rango de (40)"]. 


Sea A una matriz de m x n, y B una matriz de n x p tales que 
AB = 0. Demuestre que rango A + rango B <= n. [Sugerencia: 
Considere que uno de los cuatro subespacios Nul A, Col A, Nul 
B y Col B se encuentra en uno de los otros tres subespacios]. 


Si A es una matriz de m x n de rango r, entonces la factoriza- 
ción de rango de A es una ecuación de la forma A = CR, donde 
C es una matriz de m x r de rango r, y R es una matriz de r x n 
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de rango r. Tal factorización siempre existe (ejercicio 38 en la 
sección 4.6). Dadas dos matrices A y B de m x n, utilice facto- 
rizaciones de rango de A y B para demostrar que 


rango (A + B) S rango A + rango B 


[Sugerencia: Escriba A + B como el producto de dos matrices 
particionadas]. 


17. Una submatriz de una matriz A es cualquier matriz que re- 
sulta de la eliminación de algunas filas y/o columnas (o de nin- 
guna) de A. Es posible demostrar que A tiene rango r si y solo 
si A contiene una submatriz invertible de r x r y ninguna sub- 
matriz cuadrada mayor es invertible. Demuestre parte de este 
enunciado explicando: a) por qué una matriz A de m x n y ran- 
go r tiene una submatriz A¡ de m x r y rango r, y b) por qué 
A; tiene una submatriz invertible A, de r x r. 


El concepto de rango desempeña un papel importante en el diseño de 
sistemas de control de ingeniería, como el sistema del transbordador 
espacial mencionado en el ejemplo introductorio de este capítulo. Un 
modelo de espacios de estado de un sistema de control incluye una 
ecuación en diferencias de la forma 


X2+1 = Ax + Bu; parak = Q, 1,... (1) 


donde A es de n x n, B es de n x m, {Xk} es una secuencia de 
“vectores de estado” en R” que describe el estado del sistema en 
tiempos discretos, y {ug} es una secuencia de control o de entrada. 
Se dice que el par (A, B) es controlable si 


rango [B AB A?B A"! B]=n (2) 


La matriz que aparece en la ecuación (2) se llama matriz de contro- 
labilidad del sistema. Si (4, B) es controlable, entonces el sistema 
se puede controlar, o conducir del estado 0 a cualquier estado espe- 
cificado v (en R”) en un máximo de n pasos, simplemente eligiendo 
una secuencia de control adecuada en R”. Este hecho se ilustra en 
el ejercicio 18 para n = 4 y m = 2. Para un análisis adicional de la 


capacidad de control, visite el sitio Web de este libro (estudio de caso 
del capítulo 4). 


18. Suponga que A es una matriz de 4 x 4 y B es una matriz de 
4 x 2, y sea que uo,..., Uz representen una secuencia de vec- 
tores de entrada en R?. 


a) Establezca xy = 0, calcule x;,..., X4 a partir de la ecua- 
ción (1), y escriba una fórmula para x4 que implique a la 
matriz de controlabilidad M que aparece en la ecuación (2). 
(Vota: La matriz M se construye como una matriz particio- 
nada; su tamaño total aquí es 4 x 8). 


b) Suponga que (A, B) es controlable y v es cualquier vector 
en R4. Explique por qué existe una secuencia de control 
uo,..., u3 en R? tal que x4 = v. 


Determine si los pares de matrices de los ejercicios 19 a 22 son con- 
trolables. 


9 1 0 
19. A=| 0—9 0|,B= 
0 0 5 
8—3 0 
20. A=|.2 5 1ļ,B= 
0 0-5 
0 1 0 0 1 
0 0 1 0 
21. [MA=| o 0 ó pala 
—2 —4.2 —4.8 -3.6 —1 
0 1 0 0 1 
0 0 1 0 0 
AA o 0 0 ES 
=i 0.0 15 —1 
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Valores propios y 


vectores propios 


EJEMPLO INTRODUCTORIO 


Sistemas dinámicos y 
búhos manchados 


En 1990 el búho manchado norteño se convirtió en el centro 
de una controversia nacional sobre el uso y el mal uso de los 
majestuosos bosques en el Pacífico Noroccidental de Estados 
Unidos. Los ambientalistas convencieron al gobierno federal 
de que el búho estaría en riesgo de extinción si continuaba la 
tala en los antiguos bosques (con árboles de más de 200 años 
de edad), donde el búho prefiere vivir. La industria maderera, 
anticipando la pérdida de 30,000 a 100,000 puestos de trabajo 
como resultado de las nuevas restricciones gubernamentales 
sobre la tala, argumentó que el búho no debería estar 
clasificado como “especie amenazada” y citó diferentes 


reportes científicos publicados para apoyar su caso.! 


En medio del fuego cruzado entre los grupos antagónicos, 
los ecologistas matemáticos intensificaron su afán de compren- 
der la dinámica poblacional del búho. El ciclo de vida de un 
búho manchado se divide naturalmente en tres etapas: juvenil 
(hasta un año de edad), subadulto (de 1 a 2 años) y adulto (más 
de 2 años). Los búhos se aparean de por vida en las etapas de 
subadulto y adulto, y empiezan a criar cuando son adultos. 
Viven alrededor de 20 años y cada pareja requiere aproxima- 
damente 1000 hectáreas (4 millas cuadradas) como su propio 
territorio. Un tiempo fundamental en el ciclo de vida es cuando 
los búhos juveniles dejan el nido. Para sobrevivir y convertirse 
en un subadulto, un búho juvenil debe tener éxito para encon- 
trar un nuevo territorio para vivir (y en general, una pareja). 


1 “The Great Spotted Owl War”, Reader’s Digest, noviembre de 1992, 
pp. 91-95. 





Un primer paso en el estudio de la dinámica poblacional 
consiste en modelar la población a intervalos anuales, en tiem- 
pos que se denotan con k = 0, 1, 2,... En general, se supone 
que hay una relación 1:1 de machos a hembras en cada etapa 
del ciclo de vida y se cuentan solamente las hembras. 

La población en cada año k se describe con un vector 
Xr = (jk Sk ap), donde jg, Sk y az son los números de hembras 
en las etapas juvenil, subadulto y adulto, respectivamente. 


Utilizando datos reales de estudios demográficos, R. 
Lamberson y sus colaboradores consideraron el siguiente 
modelo matricial por etapas:? 


Jk+ı 0.0. .33 [| Jr 

Sk+1 = .18 0 0 Sk 

Ak+1 0 .71 .9%4 Ak 
Aquí, el número de nuevas hembras juveniles en el año 
k + 1 es .33 veces el número de hembras adultas en el año k 
(según la tasa promedio de nacimientos por pareja de búhos). 
Asimismo, 18% de los búhos juveniles sobreviven para con- 
vertirse en subadultos, en tanto que 71% de los subadultos y 
94% de los adultos sobreviven para contarse como adultos. 


El modelo matricial por etapas es una ecuación en 
diferencias de la forma x¡+1 = Ax. A esta ecuación con 
frecuencia se le llama sistema dinámico (o sistema 


2 R. H. Lamberson, R. McKelvey, B. R. Noon y C. Voss, “A Dynamic Ana- 
lysis of the Viability of the Northern Spotted Owl in a Fragmented Forest 
Environment”, Conservation Biology 6 (1992), pp. 505-512. También, una 
comunicación privada del profesor Lamberson, 1993. 
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dinámico lineal discreto), ya que describe los cambios en 
un sistema conforme transcurre el tiempo. 


La tasa de sobrevivencia del 18% de búhos juveniles 
en la matriz por etapas de Lamberson es la entrada más 
afectada por la cantidad de bosque antiguo disponible. 

En realidad, el 60% de los búhos juveniles normalmente 
sobreviven para dejar el nido, pero en la región de Willow 
Creek, California, estudiada por Lamberson y sus 
colaboradores, tan solo al 30% de los búhos juveniles que 
dejaron el nido les fue posible encontrar un nuevo territorio 
para vivir. Los restantes perecieron durante la búsqueda. 


Un motivo significativo para el fracaso de los búhos 
en encontrar nuevas áreas de distribución es el aumento en 
la fragmentación de las áreas con árboles antiguos, debido a la 
tala total de áreas dispersas en terrenos con árboles antiguos. 
Cuando un búho sale de la región protectora del bosque y 
cruza un área talada, aumenta drásticamente el riesgo de 
sufrir un ataque por parte de los depredadores. En la sección 
5.6 se mostrará que el modelo descrito predice la eventual 
extinción de búhos, pero que si el 50% de los búhos juveniles 
que sobreviven al dejar el nido también encuentran nuevas 
áreas de distribución, entonces se salvaría su población. 





El objetivo de este capítulo es descomponer la acción de una transformación lineal x > Ax en 
elementos que sean de fácil visualización. Excepto por un breve paréntesis en la sección 5.4, 
en este capítulo todas las matrices son cuadradas. Las principales aplicaciones descritas aquí 
son para sistemas dinámicos discretos, incluyendo el ya mencionado asunto de los búhos 
manchados. Sin embargo, los conceptos básicos, vectores propios y valores propios, son úti- 
les en matemáticas puras y aplicadas, y se presentan en situaciones más generales que las que 
aquí se consideran. Los valores propios también sirven para estudiar ecuaciones diferenciales 
y sistemas dinámicos continuos, brindan información crítica en diseños de ingeniería, y se 
originan de manera natural en campos de la física y la química. 


VECTORES PROPIOS Y VALORES PROPIOS 


No obstante que una transformación x > Ax puede mover vectores en diversas direcciones, 
a menudo sucede que hay vectores especiales sobre los cuales la acción de A es bastante 
simple. 


EJEMPLO 1 Sean A = [i opis El y v= ll En la figura 1 se muestran 





1 0 1 
las imágenes de u y v bajo la multiplicación por A. En efecto, Av es precisamente 2v. Así, 
A tan solo “estira” o dilata a v. E 
* 
J Av 
=- v A 
Y K u 14 Su 
Y 
HA + A Xx; 
y 1 
Au “y 





FIGURA 1 Efectos de la multiplicación por A. 


Como otro ejemplo, los lectores de la sección 4.9 recordarán que si A es una matriz 
estocástica, entonces el vector de estado estable q para A satisface la ecuación Ax = X. 
Es decir, Aq = 1: q. 
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Esta sección estudia ecuaciones tales como 
Ax=2x obien Ax= —4x 


donde los vectores especiales son transformados por A en múltiplos escalares de sí mismos. 


DEFINICION Un vector propio de una matriz A de n x n es un vector distinto de cero x tal que 
Ax = Àx para algún escalar A. Un escalar À es un valor propio de A si existe una so- 
lución no trivial x de Ax = Ax; tal x es el vector propio correspondiente a À.! 


Es fácil determinar si un vector dado es un vector propio de una matriz. También es sen- 
cillo decidir si cierto escalar es un valor propio. 


Xz EJEMPLO 2 Sean A= f shna kae] y v= Ei ¿Son u y v vectores 
Au 
20 propios de A? 
Av 5 
SOLUCION 





w[i Ae 
> i JEK 


Au = —4u, pero Av + ÀV. : x 
Entonces, u es un vector propio correspondiente a un valor propio (—4), pero v no es un 


vector propio de A porque Av no es múltiplo de v. E 


EJEMPLO 3 Demuestre que 7 es un valor propio de la matriz A del ejemplo 2, y deter- 
mine los vectores propios correspondientes. 


SOLUCIÓN El escalar 7 es un valor propio de A, si y solo si la ecuación 
Ax = 7x a) 


tiene una solución no trivial. No obstante, la ecuación (1) es equivalente a Ax — 7x = 0, 
o bien, 


(A-7Dx=0 (2) 


Para resolver esta ecuación homogénea, forme la matriz 


1 6 7 0 —6 6 
a-n =|; 1-3 Jl 5 z] 
Como es evidente, las columnas de A — 7/7 son linealmente dependientes, de manera que la 


ecuación (2) tiene soluciones no triviales. Por lo tanto, 7 es un valor propio de A. Para encon- 
trar los vectores propios correspondientes, utilice operaciones de fila: 


—6 6 0 1 —1 0 
5-5 0 0 0 0 


La solución general tiene la forma a ; 


propio correspondiente a À = 7. E 


| Cada vector de esta forma con x2 # 0 es un vector 


1 Advierta que, por definición, un vector propio debe ser distinto de cero, pero un valor propio puede ser cero. 
Después del ejemplo 5, se analizará el caso donde el número 0 es un valor propio. 
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Advertencia: No obstante que en el ejemplo 3 se utilizó reducción por filas para encon- 
trar vectores propios, este método no se puede emplear para determinar valores propios. 
En general, una forma escalonada de una matriz A no presenta los valores propios de A. 


Evidentemente, la equivalencia de las ecuaciones (1) y (2) es válida para cualquier A 
en vez de A = 7. Entonces, A es un valor propio de la matriz A de n x n si y solo si la 
ecuación 


(A— A)x=0 6) 


tiene una solución no trivial. El conjunto de todas las soluciones de (3) es justo el espacio 
nulo de la matriz de A — ÀZ. Así que este conjunto es un subespacio de R” y se denomina 
el espacio propio de A correspondiente a A. El espacio propio consiste en el vector cero y 
de todos los vectores propios correspondientes a A. 

El ejemplo 3 demuestra que para la matriz A del ejemplo 2, el espacio propio corres- 
pondiente a A = 7 consiste en todos los múltiplos de (1, 1), que es la recta que pasa tanto por 
(1, 1) como por el origen. Con el ejemplo 2, se comprueba que el espacio propio asociado 
con A = —4 es la recta que pasa por (6, —5). En la figura 2, se presentan esos espacios pro- 
pios, junto con los vectores propios (1, 1) y (3/2, —5/4) y la acción geométrica de la trans- 
formación x > Ax sobre cada espacio propio. 


2 


+ Multiplicación ->, 
+ por 7, / 
SE Y 
4 75 
1 / Espacio propio 
para A=7 


NS X 2 
Multiplicación 54 |_ > ; ; 
por -4 + Espacio propio 
al para à = —4 
I (6, -5) 





FIGURA 2 Espacios propios para à = —4 y à = 7. 


4 -1 6 
EJEMPLO 4 Sea4A=|2 1 6 |. Un valor propio de A es 2. Determine una base 
2-1 8 


para el espacio propio correspondiente. 


SOLUCIÓN Forme 


4 — 6 2 0 0 2-1 6 
A-—2I1=]|2 6|-|0 2 O|=|2 —1 6 
2-1 8 0 0 2 2-1 6 


y reduzca por filas la matriz aumentada para (A — 21)x =0: 


2-1. 6 0 2-1 6 0 
2-1. 6 0|=|0 0 0 0 
2-1 6 0 0.0 0 0 


TEOREMA 1 
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En este punto, resulta claro que 2 es un valor propio de A porque la ecuación (A - 2x = 0 
tiene variables libres. La solución general es: 


X1 1/2 —3 
X2: | =X 1 + x3 0 |, x2 y x3 son libres 
X3 0 1 


El espacio propio, que se muestra en la figura 3, es un subespacio bidimensional de R?. 
Una base es 


1 -3 
Ze 1% 0 E 
0 1 


multiplicación 
por A 








FIGURA 3 A actúa como una dilatación sobre el espacio propio. 


NOTA NUMÉRICA 


El ejemplo 4 es un buen método para el cálculo manual de vectores propios en casos 
simples donde se conoce un valor propio. En general, se recomienda el uso de un 
programa matricial y la reducción por filas para encontrar un espacio propio (para 
un valor propio dado), aunque no es totalmente confiable. Ocasionalmente, el error 
por redondeo lleva a una forma escalonada reducida con el número de pivotes equi- 


vocado. Los mejores programas computacionales calculan simultáneamente aproxima- 
ciones para los valores propios y los vectores propios, con el grado de exactitud que 
se requiera, en matrices que no son muy grandes. El tamaño de las matrices que se 
logra analizar se incrementa cada año conforme mejora la potencia computacional 
y la eficiencia del software. 


El siguiente teorema describe uno de los pocos casos especiales donde los valores pro- 
pios se pueden determinar con precisión. En la sección 5.2 también se analizará el cálculo de 
valores propios. 


Los valores propios de una matriz triangular son las entradas sobre su diagonal 
principal. 
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TEOREMA 2 


DEMOSTRACIÓN Por sencillez, considere el caso 3 x 3. Si A es triangular superior, en- 
tonces, A — A/ tiene la forma 


41 an ag à 0 0 
A—-4AI= 0 d2 d23 = 0 A 0 
0 0 433 (0) 0 A 

a —A a12 413 

= 0 am—A 423 

0 0 a33— À 


El escalar A es un valor propio de A si y solo si la ecuación (A — AI)x = 0 tiene una solu- 
ción no trivial, es decir, si y solo si la ecuación tiene una variable libre. Gracias a las entra- 
das cero en A — Al, es fácil ver que (A — Af)x = 0 tiene una variable libre si y solo si al 
menos una de las entradas sobre la diagonal de A — AI es cero. Esto ocurre si y solo si À 
es igual a una de las entradas a;;, az, a33 en A. Véase el ejercicio 28 para el caso donde 


A es triangular inferior. E 
3 6 —8 4 0 0 

EJEMPLO 5 Sean A4=]|0 0 6|yB=|-2 1 0 |. Los valores propios 
0 0 2 5. 3 4 

de A son 3, 0 y 2. Los valores propios de B son 4 y 1. E 


¿Qué significa para una matriz A tener un valor propio de 0, tal como en el ejemplo 5? 

Esto ocurre si y solo si la ecuación 
Ax = 0x (4) 

tiene una solución no trivial. Pero la ecuación (4) es equivalente a Ax = 0, que tiene una so- 
lución no trivial si y solo si A no es invertible. Entonces, O es un valor propio de A si y solo si A 
no es invertible. En la sección 5.2 este hecho se agregará al teorema de la matriz invertible. 

El siguiente teorema importante se necesitará más adelante. Su demostración muestra 
un cálculo típico con vectores propios. 


Si vj,..., V, son vectores propios que corresponden a distintos valores propios 
Àl,- À; de una matriz A de n x n, entonces el conjunto (vj,..., v,) es linealmente 
independiente. 


DEMOSTRACIÓN Suponga que ([v;,..., v,) es linealmente dependiente. Puesto que vı es 
diferente de cero, el teorema 7 de la sección 1.7 indica que uno de los vectores en el con- 
junto es una combinación lineal de los vectores precedentes. Sea p el índice mínimo tal que 
Vp+1 Sea una combinación lineal de los vectores precedentes (linealmente independientes). 
Entonces, existen escalares c;,..., Cy tales que 


C1V1 + *** + CpVp = Vp+1 (5) 
Multiplicando por A ambos miembros de la ecuación (5) y considerando el hecho de que 
AV = Av; para cada k, 
CIAV1 +: +CpAVp = ÁVp+1 
CIAL VIE + CpÀpYp = Àp+1Yp+i (6) 


Multiplicando por A,+1 ambos lados de la ecuación (5) y restando el resultado de (6), 
Cir —Ap41)V1 + +++ CplAp —Ap41)Vp =0 (7) 


Puesto que {v1,..., Vp} es linealmente independiente, todos los pesos en la ecuación (7) son 
iguales a cero. Sin embargo, ninguno de los factores A;— A,+1 son cero, ya que los valores 
propios son distintos. Por lo tanto, c; = O para i = 1,..., p. No obstante, la ecuación (5) indica 
que v»+1 = 0, lo cual es imposible. En consecuencia, (v;,..., V,) no puede ser linealmente 
dependiente y, por consiguiente, debe ser linealmente independiente. E 


5.1 EJERCICIOS 


= 
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Vectores propios y ecuaciones en diferencias 


Esta sección concluye con la demostración cómo construir soluciones de la ecuación en dife- 
rencias de primer orden analizada en el ejemplo introductorio del capítulo: 


Xey1 = Ax} (k=0,1,2,...) (8) 


Si A es una matriz de n x n, entonces la ecuación (8) es una descripción recursiva de una 
secuencia {x} en R”. Una solución de la ecuación (8) es una descripción explícita de (x;), 
cuya fórmula para cada xx no depende directamente de A ni de los términos precedentes en la 
secuencia, excepto del término inicial xo. 

La forma más sencilla de construir una solución de la ecuación (8) es tomar un vector 
propio Xy y su correspondiente valor propio A, y hacer 


XxX =A'xo (k=1,2,...) (9) 
Esta secuencia es una solución, ya que 
Axy = Axo) = A(Axo) = A (2x0) = A Lx = Xi 41 


Combinaciones lineales de soluciones en la forma de la ecuación (9) ¡también son soluciones! 
Véase el ejercicio 33. 


PROBLEMAS DE PRÁCTICA 


6-3 1 
1. ¿Es5un valorpropiode 4A=|3 0 5) 
2.2 6 


2. Sixes un vector propio de A correspondiente a A, ¿qué ocurre con A3x? 


3. Suponga que bı y bz son vectores propios correspondientes a distintos valores propios 
A1 y A2, respectivamente, y también que b3 y b4 son vectores propios linealmente inde- 
pendientes asociados a un tercer valor propio Az distinto. ¿Necesariamente se deduce que 
[b;, b», b3, b4] es un conjunto linealmente independiente? [Sugerencia: Considere la 
ecuación c¡b¡ + c2b> + (c3b3 + cyba) = 0]. 


3 2 1 E 
; = i 2; E? 
CESA = Aun- välor propio:de P 8 b ¿Por qué? 6. ¿Es | —2 | un vector propio de | 3 2 7 |? Si lo es, 
2 6 4 
; -1 4 3 
LEs à = —3 un valor propio de | 6 9 F ¿Por qué? encuentre el valor propio. 
3 0 -1 
1 11 7. ¿Es A = 4 un valor propio de 2: 3 1 |? Si es así, 
¿Es A un vector propio de | A F Si lo es, encuentre -3 4 5 
el valor propio determine un vector propio correspondiente. 
4-2 3 
-1 . o 2 ; ; = i = i í 
¿Es | 1] un vector propio de ; T Si así es, deter- 8. ¿Es A 1 un valor propio de i , , pe AER dal, 


mine el valor propio. 


3 
¿Es | 2 
1 


afirmativo, determine el valor propio. 


determine un vector propio correspondiente. 


cdo 3 3 En los ejercicios 9 a 16, determine una base para el espacio propio 
un vector propio de 2 -3 -2 |? En caso asociado con cada valor propio indicado. 
-1 0 -2 3 0 
9. a ASi 
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=ä a 

10. a=| 3 ¡Jas 
1 -3 

11. TE ¿pa 
4 1 

12. a=|; TE 
4 0 1 

13. A=|-2 1 ,4=1,2,3 
-2 0 1 
4 0 -l 

14. A=|3 0 ,4=3 
2—2 5 
Ae ei 

15. A=| 2-3 2|,1=-5 
$ g D 
5 0—1 0 
1 3 0 0 

16. A=]; 7] 3 ob 
E A 


En los ejercicios 17 y 18, determine los valores propios de las 
matrices. 


0 0.0 5 0 0 
17 0 3 4 18 o 0 0 
0 0-2 -1 0 3 
1:22. 3 
19. PaaA=|1 2 3 |, encuentre un valor propio, sin rea- 


1.2 3 
lizar cálculos. Justifique su respuesta. 


20. Sin hacer cálculos, obtenga un valor propio y dos vectores 


2. Ze 2 
propios linealmente independientes de A=|2 2 2 
Di Za 2 


Justifique su respuesta. 


En los ejercicios 21 y 22, A es una matriz de n x n. Marque cada 
enunciado como verdadero o falso. Justifique su respuesta. 


21. a) Si Ax = Ax para algún vector x, entonces A es un valor 
propio de A. 
b) Una matriz A no es invertible si y solo si O es un valor pro- 
pio de A. 


c) Un número c es un valor propio de A si y solo si la ecuación 
(A — cI)x = 0 tiene una solución no trivial. 


d) Quizá sea difícil obtener un vector propio de A, pero es 
sencillo comprobar si un vector dado es, de hecho, un vec- 
tor propio. 

e) Para determinar los valores propios de A, se reduce A a una 
forma escalonada. 


22. a) Si Ax = Ax para algún escalar À, entonces x es un vector 
propio de A. 


b) Si vı y v2 son vectores propios linealmente independientes, 
entonces corresponden a distintos valores propios. 


c) Un vector de estado estable para una matriz estocástica es 
realmente un vector propio. 


d) Los valores propios de una matriz están sobre su diagonal 
principal. 


e) Un espacio propio de A es el espacio nulo de cierta matriz. 


23. Explique por qué una matriz de 2 x 2 puede tener, cuando mu- 
cho, dos valores propios distintos. También indique por qué una 
matriz de n x n puede tener, cuando mucho, n valores propios 
diferentes. 


24. Construya un ejemplo de una matriz de 2 x 2 con tan solo un 
valor propio distinto. 


25. Sea A un valor propio de una matriz A invertible. Demuestre 
que A”! es un valor propio de A”?. [Sugerencia: Suponga que x 
distinto de cero satisface Ax = Ax]. 


26. Demuestre que si A? es la matriz cero, entonces el único valor 
propio de A es 0. 


27. Demuestre que A es un valor propio de A si y solo si À es un 
valor propio de A”. [Sugerencia: Determine cómo se relaciona 
A — àl con A7 — Al]. 


28. Utilice el ejercicio 27 para completar la demostración del teore- 
ma 1 para el caso en que A es triangular inferior. 


29. Considere una matriz A de n x n con la propiedad de que la suma 
de las filas sea igual al mismo número s. Demuestre que s es un 
valor propio de A. [Sugerencia: Encuentre un vector propio]. 


30. Considere una matriz A de n x n tal que las sumas de columnas 
sean iguales al mismo número s. Demuestre que s es un valor 
propio de A. [Sugerencia: Utilice los ejercicios 27 y 29]. 


En los ejercicios 31 y 32, sea A la matriz de la transformación lineal 
T. Sin escribir A, encuentre un valor propio de A y describa el espacio 
propio. 


31. Tes la transformación sobre R? que refleja los puntos con res- 
pecto a una recta que pasa por el origen. 


32. T es la transformación en R? que gira los puntos alrededor de 
alguna recta que pasa por el origen. 


33. Sean u y v vectores propios de una matriz A, con valores propios 
correspondientes À y u, y sean c1 y c2 escalares. Defina: 


xy = Atu + cou*v (k=0,1,2,...) 

a) ¿Qué es Xz+1 por definición? 

b) Calcule Ax; de la fórmula para x; y demuestre que 
AX; = Xx+1 Este cálculo probará que la secuencia (Xz) 


que se acaba de definir satisface la ecuación en diferen- 
cias Xp+1 = Axz (k =0, 1, 2,...). 


34. Describa cómo intentaría construir una solución de una ecuación 
en diferencias X¿+1 = AXz (k = 0,1,2,...), si le dieran xy inicial y 
resultara que este no fuera un vector propio de A. [Sugerencia: 
¿Cómo podría relacionar Xg con los vectores propios de A?] 


35. Sean u y v los vectores que se muestran en la figura, y supon- 
ga que u y v son vectores propios de una matriz A de 2 x 2 
correspondientes a los valores propios 2 y 3, respectivamente. 
Sea T : R? — R? la transformación lineal dada por T(x) = Ax 
para cada x en R?, y sea w = u + v. Haga una copia de la figura, 
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y sobre el mismo sistema de coordenadas grafique cuidadosa- a) Do 14 
mente los vectores T(u), T(v) y T(w). 12 4 | PaA Foeni 
37. 11 4 38. 4-4 2 0 
a E i | 3 -1 1 -3 | 
x r 
12 —90 30 30 30 
8 —49 15 15 15 
=> Xy 39. | 16 -52 12 0 20 
0 -—30 10 22 10 
36. Repita el ejercicio 35, suponiendo que u y v son vectores L 8 —4l 15 15 7 | 
propios de A correspondientes a los valores propios —1 y 3, 
respectivamente. T-23 57 -9 -15 59 
[M] En los ejercicios 37 a 40, utilice un programa matricial para de- 10 12 10 2 —22 
terminar los valores propios de la matriz. Después, aplique el método 40. 11 5 -3 -19 -15 
del ejemplo 4 con una rutina de reducción por filas para producir una -27 31. -27 25-37 | 
base para cada espacio propio. L -5 -15 -5 1 31 


5.2 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. El número 5 es un valor propio de A si y solo si la ecuación (A — 5I)x = 0 tiene una so- 
lución no trivial. Forme 


6-3 1 5 0 0 1-3 1 
A-51=|3 0 5|-|0 5 0O|=|3-5 5 
2 2 6 0 0 5 2.2 1 
y reduzca por filas la matriz aumentada: 
1-3 1 0 1-33 1 0 13 1.0 
3-5 5 0|=|0 4 2 0O|=]0 4 2 0 
2 2 1 0 0 8-1 0 0. 0-5 0 


En este punto, es evidente que el sistema homogéneo no tiene variables libres. Entonces, 
A — ST es una matriz invertible, lo cual significa que 5 no es un valor propio de A. 


2. Six es un vector propio de A correspondiente a A, entonces AX = AX y 
Ax = A(Ux) = Ax = 12x 


Otra vez, A%x = A(4?x) = 4(4%x) = 124x = 1%x. El patrón general, A'x = Ax, se 
demuestra por inducción. 

3. Sí. Suponga que c¡b¡ + c2b, + c3b3 + c4b4 = 0. Puesto que cualquier combinación li- 
neal de vectores propios del mismo valor propio es otra vez un vector propio para ese 
valor propio, c3b3 + cxba4 es un vector propio para A3. De acuerdo con el teorema 2, los 
vectores b;, b, y c3b3 + caba son linealmente independientes, de manera que 


cıbı + c2b2 + (c3b3 + c4b4) =0 


implica que cı = c2 = 0. Pero, c3 y c4 también deben ser cero porque bs y b4 son lineal- 
mente independientes. Por lo tanto, todos los coeficientes en la ecuación original deben 
ser iguales a cero, y los vectores bj, b», b3 y b4 son linealmente independientes. 


LA ECUACIÓN CARACTERÍSTICA 


Información útil acerca de los valores propios de una matriz cuadrada A está codificada en 
una ecuación escalar especial llamada ecuación característica de A. Un simple ejemplo nos 
llevará al caso general. 
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EJEMPLO 1 Determine los valores propios de A = E a] 


SOLUCIÓN Deben obtenerse todos los escalares À tales que la ecuación matricial 
(A—ADx=0 


tenga una solución no trivial. De acuerdo con el teorema de la matriz invertible de la sec- 
ción 2.3, este problema es equivalente a encontrar todas las A tales que la matriz de A — A 
no sea invertible, donde 


2 3 A 0 2-4 3 
a-r =l; HE i=l 3 zg 
De acuerdo con el teorema 4 de la sección 2.2, esta matriz no es invertible precisamente 


cuando su determinante es cero. De manera que los valores propios de A son las soluciones 
de la ecuación 


2-4 3 
det(A -AD = det | 3 aja 


Recuerde que 


dee d = ad — bc 


Entonces, 
det(A — àT) = (2 — 2)(—6 — 1) — (3)(8) 
=—12 + 6—24 +17 -9 
= 124 44-21 
=(1-30M+7) 


Si det(A — AI) = 0, entonces 4 = 3, o bien, A = —7. Por lo tanto, los valores propios de A 
son 3 y —7. E 


El determinante en el ejemplo 1 transformó la ecuación matricial (A — Ax = 0, que 
implica dos incógnitas (A y x), en la ecuación escalar A? + 4A — 21 = 0, que tan solo im- 
plica una incógnita. La misma idea funciona para matrices de n x n. Sin embargo, antes de pa- 
sar a matrices más grandes, se resumen las propiedades necesarias de los determinantes para 
estudiar valores propios. 


Determinantes 


Sean A una matriz de n x n, y U una forma escalonada de A obtenida mediante remplazos 
e intercambios de fila (sin escalamiento), y sea r el número de tales intercambios de fila. 
Entonces, el determinante de A, que se escribe det A, es (—1)” veces el producto de las 
entradas diagonales u;¡,..., Un, en U. Si A es invertible, todas la entradas 4;1,..., Unn SON 
pivotes (porque A — [,, y las u¡, no se escalaron a 1). Es decir, al menos u,n es cero y el 
producto 4]1 *** Uy, es cero. Así,' 


ducto d 
(=1)- pi DED S , cuando A es invertible 
det A = pivotes en U (1) 


0, cuando A no es invertible 


1 La fórmula (1) se dedujo en la sección 3.2. Los lectores que no hayan estudiado el capítulo 3 pueden emplear esta 
fórmula como la definición de det A. Es un hecho notable y no trivial que cualquier forma escalonada U obtenida 
de A sin escalar dé el mismo valor para det A. 


FIGURA 1 


TEOREMA 





TEOREMA 3 
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1 5 0 
EJEMPLO 2 Calcule detA para 4=| 2 4 —1 
02 0 


SOLUCIÓN La siguiente reducción por filas utiliza un intercambio de filas: 


1 5 0 1.5.0 1 5 0 
A=|0-6 -—1|=|0-2 O|=|0-2 0|=0U, 
022 0 0 —6 —1 0 0 -l 
De manera que det A = ( —1)!(1)X(—2)X(-1) = —2. La siguiente reducción por filas alterna- 


tiva evita el intercambio de filas y produce una forma escalonada diferente. El último paso 
suma — 1/3 por la fila 2 a la fila 3: 


1 5 0 LS 0 
A=|0-6 -1|=|0-—6 -l = U, 
0-2 0 0 0 1⁄3 
Esta vez, det A es (—1)į°(1)\(—6)(1/3) = —2, igual que antes. E 


La fórmula (1) para el determinante muestra que A es invertible si y solo si det A es 
distinto de cero. Este hecho, y la caracterización de invertibilidad establecida en la sección 
5.1, se agregan al teorema de la matriz invertible. 


El teorema de la matriz invertible (continuación) 


Sea A una matriz de n x n. Entonces, A es invertible si y solo si: 


s) El número 0 no es un valor propio de A. 


t) El determinante de A no es cero. 





Cuando A es una matriz de 3 x 3, [det Al resulta ser el volumen del paralelepípedo de- 
finido por las columnas ay, a», az de A, como se muestra en la figura 1. (Para más detalles, 
véase la sección 3.3). Este volumen es distinto de cero si y solo si los vectores a;, a», az 
son linealmente independientes, en cuyo caso la matriz A es invertible. (Si los vectores son 
distintos de cero y linealmente dependientes, entonces se encuentran sobre un plano o sobre 
una recta). 

El siguiente teorema lista los resultados, que se necesitarán, de las secciones 3.1 y 3.2. 
Aquí se incluye el inciso a) como una referencia conveniente. 


Propiedades de los determinantes 


Sean A y B matrices de n x n. 


a) A es invertible si y solo si det A + O. 
b) det (AB) = (det A)(det B). 
c) det AT = det A. 


d) Si A es triangular, entonces det A es el producto de las entradas sobre la diagonal 
principal de A. 


= 


e) La operación de remplazo de filas sobre A no cambia el determinante. Un inter- 
cambio de filas cambia el signo del determinante. Un escalamiento de filas también 
escala al determinante por el mismo factor de escala. 
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La ecuación característica 


El teorema 3a) demuestra cómo determinar cuando una matriz de la forma A — Al no es 
invertible. La ecuación escalar det(A — AI) = 0 es la ecuación característica de A, y el 
argumento en el ejemplo 1 justifica el siguiente hecho. 


Un escalar A es un valor propio de una matriz A de n x n si y solo si À satisface la 
ecuación característica 


det(A — 11) =0 


EJEMPLO 3 Encuentre la ecuación característica de 


5-2 6 -l 
0. 3-8 0 
4=lo0o 0 5 4 
0. 0 0 1 
SOLUCIÓN Forme A — Al y utilice el teorema 3d): 
5-A -2 6 -1 
0 3-4 -—8 0 
det(A — 41) = det 0 0 5-1 4 
0 0 0 1-1 


= 5-16 -M6-40=4) 
La ecuación característica es 
S-UB-M0-4)=0 
o bien, 
QA-54-30=1)=0 
Desarrollando el producto, se escribe 
1% — 144? + 682? — 1304 + 75=0 m 


En los ejemplos 1 y 3, det(A — AJ) es un polinomio en À. Se puede demostrar que si A 
es una matriz de n x n, entonces det(A — AI) es un polinomio de grado n llamado polinomio 
característico de A. 

El valor propio 5, en el ejemplo 3, tiene multiplicidad 2 porque (A — 5) ocurre dos veces 
como factor del polinomio característico. En general, la multiplicidad (algebraica) de un 
valor propio A es su multiplicidad como una raíz de la ecuación característica. 


EJEMPLO 4 El polinomio característico de una matriz de 6 x 6 es Af — 4A5 — 12A4. De- 
termine los valores propios y sus multiplicidades. 


SOLUCIÓN Factorice el polinomio 
A6 — 41° — 1244 = 14 (4? — 4A — 12) = A4(A — 6)(À + 2) 


Los valores propios son O (multiplicidad 4), 6 (multiplicidad 1) y —2 (multiplicidad 1). E 


TEOREMA 4 
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Se podrían listar los valores propios del ejemplo 4 como 0, 0, 0, 0, 6 y —2, de modo 
que los valores propios están repetidos de acuerdo con sus multiplicidades. 

Puesto que la ecuación característica para una matriz de n x n implica un polinomio 
de grado n, la ecuación tiene exactamente n raíces, contando las multiplicidades, si se per- 
miten raíces complejas. En la sección 5.5 se analizarán dichas raíces complejas, llamadas 
valores propios complejos. Hasta entonces, solo se considerarán valores propios reales, y los 
escalares continuarán siendo números reales. 

La ecuación característica es importante para fines teóricos. Sin embargo, en el trabajo 
práctico, los valores propios de una matriz más grande que 2 x 2 deberían encontrarse usando 
una computadora, a menos que la matriz sea triangular o tenga otras propiedades especiales. 
No obstante que un polinomio característico 3 x 3 es fácil de calcular a mano, quizá sea di- 
fícil factorizarlo (a menos que la matriz sea cuidadosamente seleccionada). Véase las “Notas 
numéricas” del final de esta sección. 


Similitud 

El siguiente teorema ilustra un uso del polinomio característico, y brinda un fundamento 
para varios métodos iterativos que aproximan valores propios. Si A y B son matrices de 
n x n, entonces A es similar a B si hay una matriz invertible P tal que P7!AP = B, o bien, 
de manera equivalente, A = PBP”!, Escribiendo O para P”!, se tiene O”'BO = A. Así, 
B es también similar a A, y se dice simplemente que A y B son similares. Cambiar A por 
PAP es una transformación de similitud. 


Si las matrices A y B de n x n son similares, entonces tienen el mismo polinomio carac- 
terístico y, por lo tanto, los mismos valores propios (con las mismas multiplicidades). 


DEMOSTRACIÓN Si B = PAP, entonces, 
B-14I =PTAP-APTP=PUAP-AP) =P UA-ADP 


Utilizando la propiedad multiplicativa b) del teorema 3, se calcula 


det(B — 11) = det[P'(4A—A1)P] 
= det( P7!) - det(A — ÀI) - det(P) 2) 


Puesto que det(P7!) - det(P) = det(PT1P) = det 7 = 1, de la ecuación (2) se observa que 
det(B — M) = det(A — M). A 


ADVERTENCIAS: 


1. Las matrices 


er Loa 


no son similares a pesar de tener los mismos valores propios. 

2. Similitud no es lo mismo que equivalencia por filas. (Si A es equivalente por filas 
a B, entonces B = EA para alguna matriz E invertible). En general, las operaciones 
con filas sobre una matriz cambian sus valores propios. 
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Aplicación a sistemas dinámicos 


Los valores propios y vectores propios tienen la clave para la evolución discreta de un sistema 
dinámico, como se mencionó en la introducción al capítulo. 


95.03 


EJEMPLO 5 Sea a= [03 97 


| Analice el comportamiento a largo plazo del 


sistema dinámico definido por X+; = Ax; (k = 0, 1, 2,...), con Xo = | a | 


SOLUCIÓN El primer paso consiste en determinar los valores propios de A y una base para 
cada espacio propio. La ecuación característica de A es 


.95— À .03 
.05 .97— À 


= à? — 1.92) + .92 


0 = det | | = (.95 — 2)(.97 — A) — (.03)(.05) 


Por la fórmula cuadrática, 


y — 192 y (1.92) 4(92) _ 1.92 + v.0064 





2 2 
1.92 + .08 
= ———=1 obien .92 
2 
Es rápido comprobar que los vectores propios correspondientes a A = 1 y A = 0.92 son múl- 
tiplos de 
_ 13 So 1 

vi = 5 y. v2 = =] 

respectivamente. 


El siguiente paso es escribir Xy dada, en términos de v, y v2. Esto se puede hacer porque 
[v1, v2) evidentemente es una base para R?. (¿Por qué?) De manera que existen pesos c; y c2 
tales que 


Xo = C1V1 + C2V2 =[V; va ¿| (3) 


lona les a 60 

ANA A o EE 140 

1[-1 —1]|[.60 .125 
35 Wara 9 
Cada x; es fácil de calcular, ya que vı y v2 en la ecuación (3) son vectores propios de A, con 
Avı = Vi y Ava = .92v2: 


De hecho, 


Xı = ÁXo = c1 ÁVı + c2 ÁV2 Utilizando linealidad de x > Ax, 


c1v1 + c2(.92)v2 vı y V2 son vectores propios. 
X2 = ÁXı = c1 ÁVı + c2(.92) A v2 
C1V1 + c,(.92)?v, 


y así sucesivamente. En general, 
Xx. =C1V1 + 0(.90)w) (k =0,1,2,...) 
Utilizando c; y c, de la ecuación (4), 


Xk = a2s(3 | +2259] | (k =0,1,2,...) (5) 


5.2 


EJERCICIOS 
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Esta fórmula explícita para x; da la solución de la ecuación en diferencias Xz+1 = AXz. 


.375 


Conforme k > co, (.92)* tiende a cero y xy tiende a | 625 


| = .125v,. A 


Los cálculos del ejemplo 5 tienen una aplicación interesante a las cadenas de Markov 
analizadas en la sección 4.9. Quienes hayan leído esa sección reconocerán que la matriz A 
del ejemplo 5 anterior es la misma que la matriz M de migración de la sección 4.9, que Xp 
es la distribución de población inicial entre la ciudad y los suburbios, y que xx representa la 
distribución de población después de k años. 

El teorema 18 de la sección 4.9 estableció que para una matriz tal como A, la secuencia Xz 
tiende a un vector de estado estable. Ahora se sabe por qué las xy se comportan de esa forma, 
al menos para la matriz de migración. El vector de estado estable es .125v,, un múltiplo del 
vector propio vi, y la fórmula (5) para x, muestra precisamente por qué xy > .125vyj. 


NOTAS NUMÉRICAS 





1. El software computacional como Mathematica y Maple utilizan cálculos simbóli- 
cos para encontrar el polinomio característico de una matriz de tamaño moderado. 
Pero no hay una fórmula o un algoritmo finito para resolver la ecuación caracterís- 
tica de una matriz general de n x n para n = 5. 


Los mejores métodos numéricos para encontrar valores propios evitan totalmente 
el polinomio característico. En efecto, MATLAB determina el polinomio carac- 
terístico de una matriz A calculando primero los valores propios Ay,...,A, de A y, 
luego, desarrollando el producto (A — AYNA — A2)...(A — Ay). 


Varios algoritmos comunes para estimar los valores propios de una matriz A se 
basan en el teorema 4. En los ejercicios se analiza el poderoso algoritmo QR. 
Otra técnica, llamada método de Jacobi, funciona cuando A = AT y calcula una 
secuencia de matrices de la forma 


ASA Y Akp = P]'AkPk (k=1,2,...) 


Cada matriz en la secuencia es similar a A y así tiene los mismos valores propios 
que A. Las entradas no diagonales de Az+1 tienden a cero conforme aumenta k, y 
las entradas diagonales se van aproximando a los valores propios de A. 


4. En la sección 5.8 se analizan otros métodos para calcular valores propios. 


PROBLEMA DE PRÁCTICA 


E su . 1 —4 
Encuentre la ecuación característica y los valores propios de A = a ol 


En los ejercicios 1 a 8, encuentre el polinomio característico y los 8 4 9 -2 
valores propios reales de las matrices dadas. 4 8 6 2 5 
2 T —4 -l1 5 3 —4 3 
L le 2] 2. | 4 i] 7. ] 8. | D 
—4 2 8 2 Los ejercicios 9 a 14 requieren las técnicas de la sección 3.1. De- 
3. 6 7 4 3 3 termine el polinomio característico de cada matriz, utilizando un 


desarrollo por cofactores o la fórmula especial para determinantes 
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de 3 x 3 descrita antes de los ejercicios 15 a 18 de la sección 3.1. 
[Vota: Mediante operaciones de filas no es sencillo encontrar el po- 
linomio característico de una matriz de 3 x 3, porque está implicada 
la variable A]. 


4 0 -1 3 1 1l 
9. 4 -1 10. 0 5 0 
1 0 2 2. 0 7 
3 0 0 =j 0 2 
1. |2 1 4 12. 3 1 0 
1 0 4 0 1 2 
622 0 0 — 
13. |-2 9 0 14. |-1 0 
5 8 3 2 


Para las matrices de los ejercicios 15 a 17, liste los valores propios 
reales, repetidos de acuerdo con su multiplicidad. 


5 5. 0 2 3 0 0 0Ọ0 
0. 23 6 6 2 0 0 
13. 0 0 3 -2 16: 0o 3 6 0 
o 0 0 5 LB anas 
3 0 0 0 Ọ0 
=5 1 0 0 0 
17. 3 8 0 0 0Ọ0 
07 2 1-0 
—4 1 9.2 3 


18. Se puede demostrar que la multiplicidad algebraica de un valor 
propio À es siempre mayor o igual que la dimensión del espacio 
propio correspondiente a À. Determine h en la matriz A de aba- 
jo, tal que el espacio propio para A = 4 sea bidimensional: 


3 
3 
14 
2 


ooo» 
OONN 
OAD U 


19. Sea A una matriz de n x n y suponga que A tiene n valores 
propios reales, À1,..., Àn, repetidos de acuerdo con sus multipli- 
cidades, tal que 


det (4—17) = A1 = Y2 4) (An — 1) 


Explique por qué det A es el producto de los n valores propios 
de A. (Este resultado es válido para cualquier matriz cuadrada 
cuando se consideran valores propios complejos). 


20. Utilice una propiedad de determinantes para demostrar que A y 
AT tienen el mismo polinomio característico. 


En los ejercicios 21 y 22, A y B son matrices de n x n. Indique si 
cada enunciado es verdadero o falso. Justifique cada respuesta. 


21. a) El determinante de A es el producto de las entradas diagona- 
les en A. 


b) Una operación de filas elemental sobre A no cambia el valor 
del determinante. 


c) (det A)(det B) = detAB 


d) Si A + 5 es un factor del polinomio característico de A, en- 
tonces 5 es un valor propio de A. 


22. a) SiAes3 x 3, con columnas a;, a», a3, entonces det A es igual 
al volumen del paralelepípedo formado por aj, a», az. 


b) det AT = (—1) det A. 


c) La multiplicidad de una raíz r de la ecuación característica 
de A se llama multiplicidad algebraica de r como un valor 
propio de A. 


d) Una operación de remplazo por filas sobre A no altera sus 
valores propios. 


Un método ampliamente utilizado para estimar los valores pro- 
pios de una matriz general A es el algoritmo QR. En condicio- 
nes adecuadas, este algoritmo produce una secuencia de matri- 
ces, todas similares a A, casi triangulares superiores, con entradas 
diagonales que aproximan los valores propios de A. La idea princi- 
pal es factorizar A (u otra matriz similar a A) en la forma A = Q¡Ri, 
donde O” = O”! y Ri es triangular superior. Los factores se inter- 
cambian para formar A; = RıQı, que se factoriza de nuevo como 
A, = OR); entonces, se forma A = R20», y así sucesivamente. La 
similitud de A, Aj,... se deduce del resultado más general del ejer- 
cicio 23. 


23. Demuestre que si A = QR con Q invertible, entonces A es simi- 
lara A¡ = RO. 


24. Demuestre que si A y B son similares, entonces det A = det B. 


f6 3]  _ [3⁄7 e ; 
25. sean 4 = | $ 7) =[ 377 ] 100 = [5 | ora: 4 es 


la matriz estocástica estudiada en el ejemplo 5 de la sec- 
ción 4.9]. 


a) Encuentre una base para R? que consiste en vı y otro vector 
propio va de A. 


b) Compruebe que xy se escribe en la forma Xy = vı + cv2. 


c) Para k = 1,2,..., defina xų = A*xo. Calcule xı y X2, y escriba 
una fórmula para x. Después, demuestre que X —> V; con- 
forme k aumenta. 


26. Sea A = k sl Utilice la fórmula (1) para un determi- 


nante (dada antes del ejemplo 2) para demostrar que 
det A = ad — bc. Considere dos casos: a + 0 y a = 0. 


Ee Lo a 3 1 
27. Semn A= | .3 .8 .3 |, vy=]| 6l, vw=!| 31], 
2 0 4 1 2 
—1 1 
v = Ojyw=]ļ|1 
1 1 


a) Demuestre que vı, V2, V3 son vectores propios de A. 
[Nota: A es la matriz estocástica estudiada en el ejemplo 3 
de la sección 4.9]. 


b) Sea xo cualquier vector en R3 con entradas no negativas 
cuya suma sea 1. (En la sección 4.9, a xp se llamó vector de 
probabilidad). Explique por qué existen constantes c1, C2, C3 
tales que Xp = C¡V¡ + coa + C3v3. Calcule w"xo, y deduz- 
ca que cı = 1. 

c) Para k = 1, 2,..., defina Xx, = A*xo, con xy como en el in- 
ciso b). Demuestre que x > v¡ cuando k aumenta. 


28. 


29. 


[M] Construya una matriz A de 4 x 4, valuada en los enteros, y 
compruebe que A y A” tienen el mismo polinomio característico 
(los mismos valores propios con las mismas multiplicidades). 
¿A y A” tienen los mismos vectores propios? Realice el mismo 
análisis con una matriz de 5 x 5. Escriba las matrices y sus con- 
clusiones. 


[M] Construya una matriz A de 4 x 4 valuada en los enteros. 


a) Reduzca A a una forma escalonada U sin emplear escala- 
miento por filas, y utilice U en la fórmula (1) (que está antes 
del ejemplo 2) para calcular det A. (Si A resulta ser singular, 
entonces inicie con una nueva matriz aleatoria). 


b) Determine los valores propios de A y el producto de esos 
valores propios (tan exactamente como sea posible). 


30. 
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c) Escriba la matriz A y, con cuatro lugares decimales, liste los 
pivotes en U y los valores propios de A. Calcule det A con su 
programa matricial, y compárelo con los productos encon- 
trados en los incisos a) y b). 


—6 28 21 
[M] Sea A = 4 —15 —12 |. Para cada valor de a en 
—8 a 25 


el conjunto {32, 31.9, 31.8, 32.1, 32.2}, calcule el polinomio 
característico de A y los valores propios. En cada caso, trace 
una gráfica del polinomio característico p(t) = det(A — tI) para 
0 S t S 3. Si es posible, elabore todas las gráficas sobre un 
mismo sistema de coordenadas. Describa cómo las gráficas re- 
velan los cambios en los valores propios conforme a cambia. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


La ecuación característica es 


o= d4 -4 = daf 7 


-4 
Dd 


= (1-10 - 6964) = 12-32 +18 


De la fórmula cuadrática, 


y EV 4018) 
= > = 


3 v-63 





2 


Es evidente que la ecuación característica no tiene soluciones reales, así que A no tiene 
valores propios reales. La matriz A está actuando sobre el espacio vectorial real R?, y ahí no 
existe un vector v distinto de cero, tal que Av = Av para algún escalar À. 


5.3 | DIAGONALIZACIÓN 


En muchos casos, la información valor propio-vector propio contenida en una matriz A se 
presenta en una factorización útil de la forma A = PDP”* donde D es una matriz diagonal. 
En esta sección, la factorización permite calcular rápidamente las potencias A* para valores 
grandes de k: una idea fundamental en varias aplicaciones del álgebra lineal. Posteriormente, 
en las secciones 5.6 y 5.7, se utilizará la factorización para analizar (y desacoplar) sistemas 


dinámicos. 


El siguiente ejemplo muestra que las potencias de una matriz diagonal son fáciles de 


calcular. 


EJEMPLO 1 Si p=| 


y 


5 
0 


OJ aako die 07 157 0 
3 |» entonces, = 0 3 0 3 = 0 32 


3 nm f5 As. NE o0 
Penne, A 2|5lo 3 


En general, 


k 
p*=[% y! parak= 1 E 


Si A = PDP”! para alguna P invertible con D diagonal, entonces A* es también fácil de 
calcular, como lo demuestra el siguiente ejemplo. 
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TEOREMA 5 


4 1 


lp 


SOLUCIÓN La fórmula estándar para la inversa de una matriz de 2 x 2 da 


2 1 
E 
Peal 


Entonces, por asociatividad de la multiplicación matricial, 


EJEMPLO 2 Sea A = | s e | Encuentre una fórmula para A*, dado que A = PDP- !, 


donde 


A? = (PDP"(PDP"!) = PD(P"!P) DP”! = PDDP"! 


—— pra 


I 


pmp _ [1 1] OS Y ı 
RNG E el 2||-1 -1 


A? = (PDP!) A? = (PDP!) PD? P~! = PDD?P"! = PD?*p”! 


I 


Nuevamente, 


En general, para k = 1, 


ple EA OZ 
STO ala A 3% || -1 -1 


le 34 5 -—3k 
a al z 

Una matriz cuadrada A es diagonalizable si A es similar a una matriz diagonal, es decir, 
si A = PDP”! para alguna matriz P invertible y alguna matriz D diagonal. El siguiente teo- 
rema da una caracterización de matrices diagonalizables e indica cómo construir una factori- 
zación conveniente. 


Teorema de diagonalización 


Una matriz A de n x n es diagonalizable, si y solo si A tiene n vectores propios lineal- 
mente independientes. 

En efecto, A = PDP”!, con D como matriz diagonal, si y solo si las columnas de 
P son n vectores propios linealmente independientes de A. En este caso, las entradas 
diagonales de D son valores propios de A que corresponden, respectivamente, a los 
vectores propios en P. 


En otras palabras, A es diagonalizable si y solo si hay suficientes vectores propios para 
formar una base de R”. Tal base es una base de vectores propios de R”. 


DEMOSTRACIÓN Primero, observe que si P es cualquier matriz de n x n con columnas 
Vi,--- Vm y Si D es cualquier matriz diagonal con entradas diagonales A;,..., Ay, entonces, 


AP = A| vi va ©- Val =[4v1 Av -:: Avn] (1) 
mientras que 
Ay 0 0 
0 à 0 
PD = P : . : = [A1v1 A2V2 Es An Vn ] (2) 
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Ahora suponga que A es diagonalizable y A = PDP”". Por lo tanto, esta relación se mul- 
tiplica por la derecha por P y se obtiene AP = PD. En este caso, las ecuaciones (1) y (2) 
implican que 


[Avi Ava ++: Ava] =[A1V1 A2V2 +: Anvn] (3) 
Igualando columnas, 
Avı = A1Vi, AV = A2V2, ona ÁVn = AnVn (4) 


Puesto que P es invertible, sus columnas v;,..., v, deben ser linealmente independientes. 
Asimismo, como esas columnas no son cero, entonces las ecuaciones en (4) muestran que 
Às... Àn son valores propios y vi,..., V, son los vectores propios correspondientes. Este 
argumento demuestra las partes “solo si” del primer y segundo enunciados, junto con el ter- 
cer enunciado, del teorema. 

Por último, dados cualesquiera n vectores propios V1,..., Vn, úselos para construir las 
columnas de P y utilice los valores propios correspondientes Aj,..., A, para formar D. Por 
las ecuaciones (1) a (3), AP = PD. Esto es válido sin condiciones sobre los vectores pro- 
pios. Si, en efecto, los vectores propios son linealmente independientes, entonces P es in- 
vertible (según el teorema de la matriz invertible), y AP = PD implica que A =PDP"!. m 


Diagonalización de matrices 
EJEMPLO 3  Diagonalice la siguiente matriz, si es posible. 


1 3 3 
A=|-3 -5 3 
3 3 1 


Es decir, encuentre una matriz P invertible y una matriz D diagonal tales que A = PDP™!. 


SOLUCIÓN Hay cuatro pasos para implementar la descripción en el teorema 5. 


Paso 1. Determine los valores propios de A. Como se mencionó en la sección 5.2, la mecá- 
nica de este paso es adecuada para una computadora, cuando la matriz es mayor que 2 x 2. 
Para eliminar distracciones innecesarias, el texto generalmente dará información adicional de 
utilidad para este paso. En el presente caso, la ecuación característica implica un polinomio 
cúbico que se factoriza como: 


—1? — 34? +4 
=-—( -1 +2? 


0 = det (A — àI) 


Los valores propios son à = 1 y À = —2. 


Paso 2. Encuentre tres vectores propios de A linealmente independientes. Se necesitan tres 
vectores porque A es una matriz de 3 x 3. Este es el paso crítico. Si falla, entonces el teore- 
ma 5 indica que A no se puede diagonalizar. El método de la sección 5.1 produce una base 
para cada espacio propio: 


1 
Base para à = 1: v= | —1 
1 
—1 —1 
Base para À = —2: v = 1 y v= 
0 1 


Puede comprobar que (v;, va, v3) es un conjunto linealmente independiente. 
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TEOREMA 6 


Paso 3. Construya P con los vectores del paso 2. No es importante el orden de los vectores. 
Utilizando el orden seleccionado en el paso 2, forme 


1 —1 -—1 
P =|v, V2 v] = —1 1 0 
o 1 


Paso 4. Construya D con los valores propios correspondientes. En este paso, resulta esen- 
cial que el orden de los valores propios coincida con el orden elegido para las columnas 


de P. Utilice dos veces el valor propio A = —2, uno para cada vector propio correspondiente 
ad=-2: 
1.0.0 
D=|0 2 0 
0 0-2 


Es buena idea comprobar que P y D realmente funcionen. Para evitar el cálculo de P”?, 
simplemente compruebe que AP = PD. Esto es equivalente a A = PDP”' cuando P es in- 
vertible. (Sin embargo, jasegúrese que P sea invertible!) Calcule 


P -3 -3 1 —1 -1 I 2 A2 
AP = | -3 -5 -3 -1 1 0[|=|-1 2 0 
3 3 1 1 0 1 1 0 -2 
—1 -—1 1 0 0 l- 2-2 
PD=|-1 1 0-2 0O|=|-1-2 0 El 
1 0 1 0o 0 -2 1 0 -2 


EJEMPLO 4 Sies posible, diagonalice la siguiente matriz. 


2 4 3 
A=|-4 -6 3 
3 3 1 


SOLUCIÓN La ecuación característica de A resulta ser exactamente la misma que en el 
ejemplo 3: 


0 = det (A — AI) = —1° — 314? + 4 = — (å — 1) + 2}? 


Los valores propios son A = 1 y A = —2. No obstante, es fácil comprobar que cada espacio 
propio es tan solo unidimensional: 


Base para A = 1: vy=|-l 


Base para A = —2: vV = 1 


No existen más valores propios, en tanto que cada vector propio de A es un múltiplo de vı 
o de v2. Por consiguiente, es imposible construir una base de R? utilizando vectores propios 
de A. De acuerdo con el teorema 5, A no es diagonalizable. E 


El siguiente teorema proporciona una condición suficiente para que una matriz sea 
diagonalizable. 


Una matriz de n x n con n valores propios distintos es diagonalizable. 


TEOREMA 7 
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DEMOSTRACIÓN Sean v;,..., vn los vectores propios correspondientes a los n valores 
propios diferentes de una matriz A. Entonces, (v;,..., v,) es linealmente independiente, 
de acuerdo con el teorema 2 de la sección 5.1. Por lo tanto, A es diagonalizable, según el 
teorema 5. E 


No es necesario que una matriz de n x n tenga n valores propios distintos para ser dia- 


gonalizable. La matriz de 3 x 3 del ejemplo 3 es diagonalizable aun cuando tenga solamente 
dos valores propios diferentes. 


EJEMPLO 5 Determine si la siguiente matriz es diagonalizable. 


5—8 1 
A=|0 0 7 
0 0 -2 


SOLUCIÓN ¡Esto es fácil! Como la matriz es triangular, sus valores propios son evidente- 
mente 5, 0 y —2. Al ser A una matriz de 3 x 3 con tres valores propios distintos, entonces A 
es diagonalizable. E 


Matrices cuyos valores propios no son diferentes 


Si una matriz A de n x n tiene n valores propios distintos, con los vectores propios correspon- 
dientes V1,..., Vn, yY si P = [v1 *** vr], entonces P es automáticamente invertible porque sus 
columnas son linealmente independientes, según el teorema 2. Cuando A es diagonalizable, 
pero tiene menos de n valores propios diferentes, sigue siendo posible construir P en una for- 
ma que la hace automáticamente invertible, como lo demuestra el siguiente teorema. ! 


Sea A una matriz de n x n cuyos distintos valores propios son À1,..., Àp. 


a) Para 1 S k £ p, la dimensión del espacio propio para Àx es menor o igual que la 
multiplicidad del valor propio Az. 


b) La matriz A es diagonalizable si y solo si la suma de las dimensiones de los espacios 
propios es igual a n, y esto ocurre si y solo si: i. se factoriza completamente el poli- 
nomio característico en factores lineales y ii. la dimensión del espacio propio para 
cada Ay es igual a la multiplicidad de Az. 


c) Si A es diagonalizable y B; es una base para el espacio propio asociado con Az 
para cada k, entonces la colección de vectores total en los conjuntos B;,..., B, for- 
ma una base de vectores propios para R”. 


EJEMPLO 6  Diagonalice la siguiente matriz, si es posible. 


5 0 0 0 
05 0 0 
A=) i 43 0 
-1 -2 0 3 


l La demostración del teorema 7 es larga, pero no difícil. Por ejemplo, véase S. Friedberg, A. Insel, y L. Spence, 
Linear Algebra, 4a. ed. (Englewood Cliffs, NJ: Prentice-Hall, 2002), sección 5.2. 
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SOLUCIÓN Puesto que A es una matriz triangular, los valores propios son 5 y —3, cada uno 
con multiplicidad 2. Utilizando el método de la sección 5.1, se encuentra una base para cada 
espacio propio. 


—8 —16 
Base para A = 5: v= : y v= ; 
0 1 
0 0 
Base para À = —3: V3 = E y v= 
0 1 
El conjunto ([v;,..., va) es linealmente independiente, según el teorema 7. Así, la matriz 


P = [vi *** va] es invertible, en tanto que A = PDP 71. donde 


-8 -16 0 0 5 0 0 0 
4 40 0 0 5 0 0 

P=| > o ı o| 7 RA LS 03 0 m 
0 1 0 1 0 0 0-3 


PROBLEMAS DE PRÁCTICA 
1. Calcule A8, donde A = |: E) 


=2 7 1 


son vectores propios de A. Utilice esta información para diagonalizar A. 


2. Sean Á = [z a = H yv = H Suponga que le han dicho que vı y va 


3. Sea A una matriz de 4 x 4 con valores propios 5, 3 y —2, y suponga que se sabe que 
el espacio propio para A = 3 es bidimensional. ¿Se dispone de suficiente información 
para determinar si A es diagonalizable? 


5.3 EJERCICIOS 


En los ejercicios 1 y 2, sea A = PDP”! y calcule A*. 


5 7 2 0 
eei I-G $] 


1 -1 oļf3 o oJ]f o -ıı -ı 
=j er nii SP e 
2 P=|, T J 0 -i o o 3ļ|-1 -1 0 


=1 -1 


= 
o 
N 
© 


2 3 0 3 


En los ejercicios 3 y 4, use la factorización A = PDP”! para calcular 6. A= 
A%, donde k representa un entero positivo arbitrario. 


ö ng i Ei 3 0 -l 3 0 0 0 0 1 
a a 
3. | | = | | | | =|0 1 -3 0.4.0 3 1 9 
2Za=-b) b 2 1|0  »b||-2 1 1 0 0 0 0 3 1 0 3 
4 1 -6| |3 -2||-3 O0Ojļ|-—-1 2 En los ejercicios 7 a 20, diagonalice las matrices, si es posible. Para 
* |2 —6| |2 —1 0 2||-2 3 los ejercicios 11 a 16 y 18, se incluyen los valores propios reales 


debajo de la matriz. 
En los ejercicios 5 y 6, la matriz A se factoriza en la forma PDP”". 
Utilice el teorema de diagonalización para encontrar los valores pro- 7. | l | 8. | 3 a] 
pios de A y una base para cada espacio propio. 6 1 


13. 


15. 


17. 


19. 


2 -1 1 3 
[4] w fa 3] 
0 1 1 Ed 
2. 1 2 ajo de 38% 4 
3 3 2 «Ji 1 3 
AS Ps 
2 2 2 0 2 
1 3 -I aa e aa 
-1 2 2 -lo o0 3 
A=1,5 1=2,3 
E 1 2 3 
1 2 1 i e a 
-1 -1 0 6 ji 3 1 
à=0,1 2=0 
2 0 0 A 
E 
2 2 0 E E 
2 2 2 
à = —2,—1,0 
53 0 9 3 0 0 0 
0 3 12 m 0 
0 0 2 0 0 0 2 0 
Lo 0 o0 2] 1 0 0 3 | 


En los ejercicios 21 y 22, A, B, P y D son matrices de n x n. Indique 
si cada enunciado es verdadero o falso. Justifique cada respuesta. 
(Antes de intentar resolver estos ejercicios, estudie con cuidado los 
teoremas 5 y 6, y los ejemplos de esta sección). 


21. 


22. 


23. 


24. 


a) A es diagonalizable si A = PDP”! para alguna matriz D y 
alguna matriz P invertible. 


b) Si R” tiene una base de vectores propios de A, entonces A es 
diagonalizable. 


c) A es diagonalizable si y solo si A tiene n valores propios, 
contando multiplicidades. 


d) Si A es diagonalizable, entonces A es invertible. 


a) A es diagonalizable si A tiene n vectores propios. 


b) Si A es diagonalizable, entonces A tiene n valores propios 
distintos. 

c) Si AP = PD, con D diagonal, entonces las columnas distin- 
tas de cero de P deben ser vectores propios de A. 


d) Si A es invertible, entonces A es diagonalizable. 
A es una matriz de 5 x 5 con dos valores propios. Un espacio 


propio es tridimensional y el otro espacio propio es bidimensio- 
nal. ¿A es diagonalizable? ¿Por qué? 


A es una matriz de 3 x 3 con dos valores propios. Cada espacio 
propio es unidimensional. ¿A es diagonalizable? ¿Por qué? 


25. 


26. 


27. 


28. 


29. 


30. 


31. 


32. 
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A es una matriz de 4 x 4 con tres valores propios. Un espacio 
propio es unidimensional, y uno de los otros espacios propios 
es bidimensional. ¿Es posible que A no sea diagonalizable? 
Justifique su respuesta. 


A es una matriz de 7 x 7 con tres valores propios. Un espacio 
propio es bidimensional, y uno de los otros espacios propios 
es tridimensional. ¿Es posible que A no sea diagonalizable? 
Justifique su respuesta. 


Demuestre que si A es diagonalizable e invertible, entonces tam- 
bién lo es A7!, 


Demuestre que si A tiene n vectores propios linealmente in- 
dependientes, entonces ocurre lo mismo con A”, [Sugerencia: 
Use el teorema de diagonalización). 


Una factorización A = PDP”' no es única. Demuestre esto 
3 0 LE 

0 5 | utilice 

la información del ejemplo 2 para encontrar una matriz P, tal 

que A == PDP; !. 


para la matriz A del ejemplo 2. Con Dı = | 


Con A y D como en el ejemplo 2, encuentre una P2 invertible, 
distinta de la P del ejemplo 2, tal que A = P2DP»”!. 


Construya una matriz de 2 x 2 distinta de cero que sea inverti- 
ble, pero no diagonalizable. 


Construya una matriz de 2 x 2 no diagonal que sea diagonaliza- 
ble, pero no invertible. 


[M] En los ejercicios 33 a 36, diagonalice las matrices. Utilice la 
instrucción de valores propios de su programa matricial para obtener 
los valores propios y, luego, calcule bases para los espacios propios 
como en la sección 5.1. 


33. 


34. 


35. 


36. 


e o 


—56 32 —28 44 
-14 -14 6 —14 
| 42 -33 21 —45 
Pa. re. EE Y 


-7 —9 0 7 14 
—10 


[| -3 -13 -—7 10 11 
[13 -—12 9 -15 9 
6 —5 9 -15 9 
6 -12 -=5 6 9 
6 -12 9 —8 l 
L—6 12 12 —6 -2 
[24 —6 2 6 2 
12 51 9 —99 9 


0 —63 15 63 63 
—63 9 
—63 





[0 68 2 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 
1. det (4 — A) = 2-31 +2 =(A — 2) — 1). Los valores propios son 2 y 1, y los 


vectores propios correspondientes son V; = H yv = | | Ahora, forme 


Sifa a f2 o0 a] dl =1 
e a A 


Como A = PDP™!, 


eaoaai E irai 
ESE, E lo 18f|-2 3 
EN E 
2 alo alles 
766 —765 
510 509 


2. Calcule Avı = E I] = i =1-v, y 


sE JEJ 


De manera que vı y v2 son vectores propios para los valores propios 1 y 3, respectiva- 
mente. Entonces, 


z =1 32 I1 0 
A = PDP donde, P=|; 119 D = 0 3 


3. Sí, A es diagonalizable. Existe una base ([v¡, V2} para el espacio propio asociado a 
A = 3. Asimismo, habrá al menos un vector propio para A = 5 y uno para À = —2, deno- 
tados mediante v3 y v4. Entonces, {V1, V2, V3, V4} es linealmente independiente de acuer- 
do con el teorema 2 y el problema de práctica 3 de la sección 5.1. No pueden existir más 
vectores propios que sean linealmente independientes de v1, V2, V3, V4, porque los vectores 
están en R4. Por consiguiente, los espacios propios para À = 5 y A = —2 son ambos uni- 
dimensionales. De acuerdo con el teorema 7b) se tiene que A es diagonalizable. 


VECTORES PROPIOS Y TRANSFORMACIONES LINEALES 


El objetivo de esta sección es entender la factorización matricial A = PDP”! como un 
enunciado sobre transformaciones lineales. Se verá que la transformación x > Ax es esen- 
cialmente lo mismo que el muy simple mapeo u > Du, cuando se estudia desde un enfo- 
que adecuado. Una interpretación similar se aplicará a D y A, aun cuando D no sea una 
matriz diagonal. 

De la sección 1.9, recuerde que cualquier transformación lineal T de R” a R” se im- 
plementa mediante la multiplicación por la izquierda por una matriz A, llamada matriz están- 
dar de T. Ahora se necesita el mismo tipo de representación para cualquier transformación 
lineal entre dos espacios vectoriales de dimensión finita. 


x 18) 


lx] g 


FIGURA 2 


Multiplicación 
por M 


Te 


5.4 Vectores propios y transformaciones lineales 289 


La matriz de una transformación lineal 


Sean V un espacio vectorial n-dimensional, W un espacio vectorial m-dimensional y T cual- 
quier transformación lineal de Va W. Para asociar una matriz con 7, se eligen bases (ordena- 
das) B y C para V y W, respectivamente. 

Dada cualquier x en V, el vector de coordenadas [x]; está en R” y el vector de coordena- 
das de su imagen, [7(x)] e está en R”, como se indica en la figura 1. 


| 
| [760 


l 
—-7 


R” 





FIGURA 1 Una transformación lineal de V a W. 


Es fácil encontrar la conexión entre [x] y [7(x)]¿. Sea (bj,..., b,) la base B para V. 
Si x = rıb; + *** + r;yb,, entonces, 
ri 
k=] : 
Fn 
y 
T(x) = T (rıb; RAE r,D,,) = rıT (bı) Aroia TaT (bn) (1) 


porque T es lineal. Ahora, como el mapeo coordenado de W a R” es lineal (teorema 8 de la 
sección 4.4), la ecuación (1) conduce a 


[TŒ le = rn[T 0) le +++ +r,[7(b,) 1, (2) 


Puesto que los vectores de coordenadas C están en R”, así la ecuación vectorial (2) se escribe 
como una ecuación matricial; a saber, 


[7601 = MIxl, (3) 
donde 


M=|[[7(b91, [Tb] = [Te] (4) 


La matriz M es una representación matricial de T, llamada matriz para T respecto a las 
bases B y C. Véase la figura 2. 

La ecuación (3) indica que, en lo concerniente a los vectores de coordenadas, la acción 
de T sobre x se puede considerar una multiplicación por la izquierda por M. 


EJEMPLO 1 Suponga que B = (bj, b,) es una base para V y C = [e,, €2, €3} es una base 
para W. Sea T : V — W una transformación lineal con la propiedad 


T (bı) = 3c — 2c2 + 563 y T (b2) = de + 70, —C3 


Determine la matriz M para T respecto a B y C. 
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SOLUCIÓN Los vectores de coordenadas C de las imágenes de bı y bz son 


3 4 
[T(b1)], = | -2 y [7(b)l.=| 7 
5 —1 
Por lo tanto, 
3 4 
M=|-2 7 E 
5 —1 


Si B y C son bases para el mismo espacio V y si T es la transformación identidad 
T(x) = x para x en V, entonces la matriz M en la ecuación (4) es justo una matriz de cam- 
bio de coordenadas (véase la sección 4.7). 


Transformaciones lineales de V en V 


x T To En el caso común donde W es igual a V y la base C coincide con B, la matriz M en (4) se 
denomina matriz para T respecto a B, o simplemente B-matriz para T, y se denota con 
[71 Véase la figura 3. 
La B-matriz para T': V—> V satisface 


Multiplicación 


— Ln 
[xls por [T]; [17001 [7() ], =[7 ],[x], para toda x en V (5) 


FIGURA 3 
EJEMPLO 2 El mapeo T: P, — P, definido por 


T (ao + aıt + azt’) = adı + 2azt 


es una transformación lineal. (Los estudiantes de cálculo reconocerán T como el operador 
derivada). 


a) Determine la B-matriz para T, cuando B es la base {1, t, t°}. 


b) Compruebe que [7 (p) ]¿ = [7 ],¿[p ], para toda p en PP». 


SOLUCIÓN 

a) Determine las imágenes de los vectores básicos: 
TD)=0 El polinomio cero 
T0)=1 El polinomio cuyo valor siempre es 1 
T?) = 2t 


Después, escriba los vectores de B-coordenadas de T(1), T(0) y T(1?) (que en este ejemplo 
se localizan por inspección) y júntelos en la B-matriz para T: 


0 1 0 

[T() ], = aA [TO]; = Al (151, = ] 
0. 10 
Milo 2 
0.0.0 
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b) Para un general p(t) = ay + aıt + azt? 


a1 
[T(p) ],, = [41 + 2a,1 |, = | 2a, 
0 





0 1 0 ao 
=|0 0 2 4 | = [ T 1,1 p ls 
0o 0 0 4) 
Véase la figura 4. E 
T 
a, +2a,t 
Pp, motat +a, t P, 
A 
a 
4, 
Multiplicación 


4 


DA Y 
R3 Le a eree 
— B R3 2a, 
u 0 
FIGURA 4 Representación matricial de una 
transformación lineal. 


Transformaciones lineales sobre R” 


En un problema aplicado que implica a R”, en general una transformación lineal T aparece 
primero como una transformación matricial, x > Ax. Si A es diagonalizable, entonces hay 
una base B para R” que consiste en vectores propios de A. A continuación, el teorema 8 de- 
muestra que, en este caso, la B-matriz para Tes diagonal. Diagonalizar A equivale a encontrar 
una representación matricial diagonal x > Ax. 


TEOREMA 8 Representación matricial diagonal 
Suponga que A = PDP”!, donde D es una matriz de n x n diagonal. Si B es la base 
para R” formada con las columnas de P, entonces D es la B-matriz para la transfor- 
mación Xx > Ax. 


DEMOSTRACIÓN Denote las columnas de P con b;,..., b,, de manera que B = (b,,..., b,) 
y P= [b;, -:* b,]. En este caso, P es la matriz de cambio de coordenadas Pg analizada en 


la sección 4.4, donde 


Plxlg=x y [x]; = P™'x 


Si T(x) = Ax para x en R”, entonces, 


[T]y =[[T(b)]g +: [Tn)]g] Definición de [7], 
= I [Abi]; =-  [Ab, ls] Porque T(x) = Ax 
=[|P7!Ab; --- P7*Ab,] Cambio de coordenadas 
= P!A[b, -:- b,] Multiplicación matricial 
= PAP (6) 


Puesto que A = PDP”!, entonces se tiene | 7 ls = PAP = D. E 
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7 


EJEMPLO 3 Defina T : R? > [R? por T(x) = Ax, donde A = E 


A] Encuentre 
una base B para [R? con la propiedad de que la B-matriz para T es una matriz diagonal. 


SOLUCIÓN Del ejemplo 2 de la sección 5.3, se conoce que A = PDP”*!, donde 


e 


Las columnas de P, denotadas mediante b, y b», son vectores propios de A. Según el teo- 
rema 8, D es la B-matriz para T cuando B = (bj, b2). Los mapeos x > Ax y u > Du des- 
criben la misma transformación lineal respecto a diferentes bases. E 


Similitud de representaciones matriciales 


La demostración del teorema 8 no utilizó la información de que D era diagonal. Por lo tanto, 
si A es similar a una matriz C, con A = PCP"!, entonces C es la B-matriz para la trans- 
formación x > Ax cuando la base B está formada por las columnas de P. La figura 5 ilustra 
la factorización A = PCP”!. 


Multiplicación 

x Ax 

por A 
Multiplicación Multiplicación 
por P7! por P 

Multiplicación 

xX AX 

xls TE [Ax]; 


FIGURA 5 Similitud de dos representaciones matriciales: 
A = PCP. 


Inversamente, si T : R” — R” está definida por T(x) = Ax, y si B es cualquier base 
para R”, entonces la B-matriz para T es similar a A. En efecto, los cálculos en la demostra- 
ción del teorema 8 indican que si P es la matriz cuyas columnas provienen de los vectores 
en B, entonces, [T] g7 PAP. Así, el conjunto de todas las matrices similares a una matriz 
A coincide con el conjunto de todas las representaciones matriciales de la transformación 
xX > Ax. 


EJEMPLO 4 Sean A= É a] b; = [>| y b = El El polinomio caracterís- 


tico de A es (A + 2)?, sin embargo, el espacio propio para el valor propio —2 es unidimen- 
sional; de manera que A no es diagonalizable. Sin embargo, la base B = (by, b>) tiene la 
propiedad de que la B-matriz para la transformación x > Ax es una matriz triangular llamada 
forma de Jordan de A.!' Determine esta B-matriz. 


SOLUCIÓN SiP = [bı b2], entonces la B-matriz es PAP. Calcule 
4 —9 || 3 2 —6 —1 
ap=|; lle E ol 
= e O 6 A 2: 1 
imel > de O 
Observe que el valor propio de A está sobre la diagonal. El 


1 Cada matriz cuadrada A es similar a una matriz en forma de Jordan. La base utilizada para generar una forma 
de Jordan consiste en vectores propios y los llamados “vectores propios generalizados” de A. Véase el capítulo 9 de 
Applied Linear Algebra, 3a. ed. (Englewood Cliffs, NJ: Prentice-Hall, 1988), de B. Noble y J. W. Daniel. 
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NOTA NUMÉRICA 












Una forma eficiente de calcular una B-matriz de PAP es determinando AP y, luego, 
reduciendo por filas la matriz aumentada [P AP] a [/ P7!AP]. Es innecesario un 
cálculo por separado de P”!, Véase el ejercicio 15 de la sección 2.2. 


PROBLEMAS DE PRÁCTICA 


1. Determine Tíag + at + axt?), si T es la transformación lineal de P, a P2 cuya matriz 
respecto a B = (1,1, 1?) es 


3 4 0 
[T]=|0 5 -1 
reg 


2. Sean A, B y C matrices de n x n. En el texto se ha demostrado que si A es similar a B, 
entonces B es similar a A. Esta propiedad, junto con los enunciados que se muestran de- 
bajo, indica que “similar a” es una relación de equivalencia. (La equivalencia por fila 
es otro ejemplo de una relación de equivalencia). Compruebe los incisos a) y b). 


a) A es similar a A. 


b) SiA es similar a B, y B es similar a C, entonces A es similar a C. 


5.4 EJERCICIOS 


1. Sean B = {b;, b2, b3} y D = {d;, d2} las bases de los espacios 5. Sea T: P2 — P; la transformación que mapea un polinomio p(t) 


vectoriales V y W, respectivamente. Sea T : V —> W una trans- 
formación lineal con la propiedad 


T (bı) = 3d; — 5d2, T(b2) = -—d; + 6d2, T(b3) = 4d, 
Determine la matriz para T respecto a B y D. 


. Sean D = {d;, d2} y B = {b;, b2} las bases para los espacios 
vectoriales V y W, respectivamente. Sea T : V —> W una trans- 
formación lineal con la propiedad 


T(d,) = 3b; — 3b2, T(d2) = —2b; + 5b, 
Determine la matriz para T respecto a D y B. 


. Sean € = [e,, ez, ez) la base estándar para R3, B = {b;, b2, b3} 
una base para un espacio vectorial V, y T : R? — V una trans- 
formación lineal con la propiedad 


T (x1, X2, X3) = (2x3 — x2)bı — (2x2)b2 + (xı + 3x3)b3 
a) Calcule T(e1), T(e2) y T(e3). 

b) Obtenga [T (e1)]g, [T (e2)]s y [T(e3)]5. 

c) Determine la matriz para T respecto a € y B. 


. Sean B = (bj, b», b3) una base para un espacio vectorial V y 
T: V>R? una transformación lineal con la propiedad 

E 2x1 E 3x2 + X3 
T(xıbı + xX2b2 + x3b3) = | =D + 5x3 
Encuentre la matriz para T respecto a B y la base estándar 
para R?. 


en el polinomio (1 + 3)p(0). 
a) Encuentre la imagen de p(1) = 3 — 21 + £?. 
b) Demuestre que T es una transformación lineal. 


c) Obtenga la matriz para T respecto a las bases (1, £, 1?) y 
{1, £, £, P}. 


. Sea T: P2 — Pa la transformación que mapea un polinomio p(t) 


en el polinomio p(s) + 21?p(+). 
a) Determine la imagen de p(t) = 3 — 2t + £. 
b) Demuestre que T es una transformación lineal. 


c) Encuentre la matriz para T respecto a las bases (1, £, 1?) y 
{1, £, £, P, tf}. 


. Suponga que el mapeo T : P2 — P, definido por 


T (ao +aıt + azt?) = 3a0 + (Sao = 2aı)t + (4a; + ar)? 


es lineal. Obtenga la representación matricial de T respecto a 
la base B = (1, £, 1?). 


. Sea B = {b;, b2, b3} una base para un espacio vectorial V. 


Encuentre T(4b; — 3b2) cuando T es una transformación lineal 
de V a V cuya matriz respecto a B es 


o0 0 1 
[T] =|2 1 -2 
1 3 1 
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p—1) 
9. Defina T: P2 —> R? por T(P) = | p@©) 
p(1) 
a) Encuentre la imagen bajo T de p(t) = 5 + 3t. 
b) Pruebe que T es una transformación lineal. 


c) Obtenga la matriz para T respecto a la base (1, £, 1?) para 
P, y la base estándar para [R3. 


p(2) 
10. Defina T : P3 — R4 por T (p) = ee 
p(0) 


a) Demuestre que T es una transformación lineal. 


b) Encuentre la matriz para T respecto a la base (1, t, P, P} 
para [Pz y la base estándar para R4. 


En los ejercicios 11 y 12, determine la -matriz para la transforma- 
ción x > Ax donde B = (bj, b»). 


2) 
2-2 


En los ejercicios 13 a 16, defina T : R? => R? por T(x) = Ax. Deter- 
mina una base B para R? con la propiedad de que [T] g es diagonal. 


0 1 2 3 

k il n a=; d 
lt. 2 4 2 

15. A=|; A w a| i 1 


17. Sean A = [E ] y B=(b,,b,) para bı = E 


11. a=| 


12. a=| 


13. a=| 


b = | al Defina T : R? —> R? tal que T(x) = Ax. 


a) Compruebe que b; es un vector propio de A, pero que A no 
es diagonalizable. 


b) Encuentre la B-matriz para T. 


18. Defina T: R? — R? mediante T(x) = Ax, donde A es una matriz 
de 3 x 3 con valores propios de 5, 5 y —2. ¿Existe una base 
B para R? tal que la B-matriz para T sea una matriz diagonal? 
Analice. 


En los ejercicios 19 a 24, compruebe los enunciados. Las matrices 
son cuadradas. 


19. Si A es invertible y similar a B, entonces B es invertible y A~! 
es similar a B7!. [Sugerencia: P7!AP = B para alguna P inver- 
tible. Explique por qué B es invertible. Luego, determine una Q 
invertible tal que Q7!AT!Q = B71]. 

20. SiA es similar a B, entonces A? es similar a B?, 


21. Si B es similar a A y C es similar a A, entonces B es similar 
aC. 


22. SiA es diagonalizable y B es similar a A, entonces B también es 
diagonalizable. 


23. Si B = P™!AP y x es un vector propio de A correspondiente a 
un valor propio A, entonces P™tx es un vector propio de B tam- 
bién asociado con À. 


24. SiA y B son similares, entonces tienen el mismo rango (dimen- 
sión del espacio imagen). [Sugerencia: Consulte los ejercicios 
complementarios 13 y 14 del capítulo 4]. 


25. La traza de una matriz cuadrada A es la suma de las entradas 
diagonales en A y se denota con tr A. Se puede comprobar que 
tr(FG) = tr(GF) para cualesquiera dos matrices F y G de n x n. 
Demuestre que si A y B son similares, entonces tr A = tr B. 


26. Se puede demostrar que la traza de una matriz A es igual a la 
suma de los valores propios de A. Compruebe este enunciado 
para el caso cuando A es diagonalizable. 


27. Sean V = R” con una base B = {b1,..., bn}, y W = R” con la 
base estándar que se denota mediante €; y considere la trans- 
formación identidad 7 : R” —> R”, donde I(x) = x. Obtenga la 
matriz para I respecto a 8 y E. ¿Cómo se llamó a esta matriz 
en la sección 4.4? 


28. Sean V un espacio vectorial con una base B = (bj,..., b,) y 
W el mismo espacio V con una base C = {¢1,..., Cn}; Z es la 
transformación identidad / : V —> W. Encuentre la matriz 
para I respecto a B y C. ¿Cómo se llamó a esta matriz en la 
sección 4.7? 


29. Sea V un espacio vectorial con una base 5 = {b;,..., b, }. Deter- 
mine la B-matriz para la transformación identidad 7 : V —> V. 


[M] En los ejercicios 30 y 31, determine la B-matriz para la trans- 
formación x > Ax donde B = (bi, b,, b3). 


6 -2 -2 
30. A=| 3 1 -2 j, 
a r S2 
1 2 -1 
b= | 1 |,b = j| 1 |, b= j| —1 
1 3 0 
—7 —48 -—16 
31. A= 1 14 6 j, 
=3 -45 =19 
—3 —2 
b; = 1 |, b = 1 |, b3 = | —1 
—3 3 


32. [M] Sea T la transformación cuya matriz estándar se presenta a 
continuación. Determine una base para [R* con la propiedad de 
que [T]; sea diagonal. 


—6 4 0 9 
= E E 
A=) i2 1 0 
-4 4 0 7 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Sea p(t) = ay + at + axt?, y calcule 


3 4 Olla 349 + 4a1 
[T()l¿ =[T Iglplg=|0 5 -—1f| a |= 5a1 — a2 
1 —2 7 ar ado — 2a1 + 742 


Así, T(p) = (3ao + 4a1) + (5a; — a2)t + (ay — 2a1 + 7a2)t?. 


2. a) A = (I) "AL, entonces A es similar a A. 


b) Por hipótesis, existen matrices invertibles P y O con la propiedad de que B = PAP 
y C = OQ” !BO. Sustituya la fórmula para B en la expresión para C, y utilice un resul- 
tado acerca de la inversa de un producto: 


C = Q™'BQ = 0 (P"AP)O = (PO) A(PO) 


Esta ecuación tiene la forma adecuada para demostrar que A es similar a C. 


5.5 | VALORES PROPIOS COMPLEJOS 


Puesto que la ecuación característica de una matriz de n x n implica un polinomio de grado 
n, la ecuación siempre tiene exactamente n raíces, contando las multiplicidades, siempre y 
cuando se admitan raíces complejas. Esta sección demuestra que si la ecuación característica 
de una matriz real A tiene algunas raíces complejas, entonces esas raíces aportan información 
importante acerca de A. La clave es dejar que A actúe sobre el espacio C” de n-adas de núme- 
ros complejos. ! 

Nuestro interés en C” no se origina por el deseo de “generalizar” los resultados de los 
capítulos anteriores, no obstante que ello abriría nuevas aplicaciones significativas en álgebra 
lineal.? Más bien, este estudio de valores propios complejos es esencial para revelar informa- 
ción “oculta” sobre ciertas matrices con entradas reales que se presentan en gran variedad de 
problemas de la vida cotidiana. Tales problemas incluyen muchos sistemas dinámicos reales 
que implican movimiento periódico, vibración o algún tipo de rotación en el espacio. 

La teoría del valor propio-vector propio matricial ya desarrollada para R” se aplica bien 
a C”. Así que un escalar complejo À satisface det(A — AD = O si y solo si existe un vector 
distinto de cero x en C” tal que Ax = Ax. Decimos que A es un valor propio (complejo) y 
x su correspondiente vector propio (complejo). 


0 
1 


el plano en sentido antihorario, un ángulo de 90%. La acción de A es periódica, ya que, 
después de cuatro de tales aplicaciones, un vector regresa a su posición original. Eviden- 
temente, ningún vector distinto de cero se mapea sobre un múltiplo de sí mismo, de ma- 
nera que A no tiene vectores propios en RR? y, por lo tanto, carece de vectores propios reales. 
En efecto, la ecuación característica de A es 


EJEMPLO 1 Si a=| 


-1 pios pi A 
0 | entonces la transformación lineal x > Ax on R? gira 


2+1=0 


1 Consulte el apéndice B para un breve análisis de números complejos. El álgebra matricial y los conceptos 
sobre espacios vectoriales reales se podrían ampliar al caso de entradas y escalares complejos. En particular, 
A(cx + dy) = cAx + dAy, para A de m x n, con entradas complejas, x, y en C”, y c, d en C. 

2 Con frecuencia, en un segundo curso en álgebra lineal se analizan dichos temas, que son de mucha importancia 
en ingeniería eléctrica. 
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Las únicas raíces son complejas: A = ¡y A = —i. Sin embargo, si se permite que A actúe 


sobre C?, entonces, [ AJ- [il-f] 
wna 


1 


Así, i y —i son valores propios, con | i | y | i | como sus vectores propios correspondien- 


tes. (En el ejemplo 2 se analiza un método para determinar vectores propios complejos). W 


El principal interés de esta sección será la matriz del siguiente ejemplo. 


5 
19 


una base para cada espacio propio. 


EJEMPLO 2 Sea A= | 


al Determine los valores propios de A, y encuentre 


SOLUCIÓN La ecuación característica de A es 


ve | e o ANO 


=1?-1.61+1 


De la fórmula cuadrática, À = 21.6 + y (—1.6) — 4] = .8 + .6i. Para el valor propio 
Aà = 0.8 + .6i, construya 


, 5-6 8.61 0 
A- (3-61 =| >; l- 0 ra] 
_[-3+.6i -6 
=f 75 Sal = 


La reducción por filas de la matriz aumentada usual es muy engorrosa a mano debido a su 
aritmética compleja. Sin embargo, a continuación se presenta una agradable observación que 
realmente simplifica el asunto: Puesto que .8 — .6i es un valor propio, el sistema 


(=.3 +.61)x1 — 6x2 = 0 


75x1 + (3 + .6i)x2 = 0 2) 


tiene una solución no trivial (con x, y x2 posiblemente números complejos). Por lo tanto, am- 
bas ecuaciones en la ecuación (2) determinan la relación entre x, y x2, y cualquier ecuación 
sirve para expresar una variable en términos de la otra.? 

La segunda ecuación en (2) conduce a 


.75x1 = (—.3 = .61)X2 
X1 = (—.4 = .8i)xX2 


Se elige x2 = 5 para así eliminar los decimales, y se obtiene xı = —2 — 4i. Una base para 
el espacio propio correspondiente a À = .8 — .6i es 


—2— 4i 
a] 


3 Otra forma de ver esto es considerando que la matriz en la ecuación (1) no es invertible, de manera que sus filas son 
linealmente dependientes (como vectores en C?) y, por consiguiente, una fila es múltiplo (complejo) de la otra. 


5.5 Valores propios complejos 297 


Cálculos semejantes para A = .8 + .6í producen el vector propio 


[EA 
V2 = 5 


Como una comprobación, calcule 


Sps wA A 
am =[ 5, all 5 l a | = (8+ 6v = 


Sorprendentemente, la matriz A del ejemplo 2 determina una transformación x —> AX 
que en esencia es una rotación. Este hecho se hace evidente cuando se grafican los puntos 
adecuados. 


EJEMPLO 3 Una manera de ver cómo la multiplicación por la matriz A del ejemplo 2 
afecta los puntos consiste en graficar un punto inicial arbitrario, por ejemplo, xy = (2, 0), 
y después graficar imágenes sucesivas de este punto con multiplicaciones repetidas por A. 


Es decir, grafique 
0 —.6 
x= 40 =| 5, ll 
¿3 
X? = AXı = k 
X3 = ÁX2,... 


La figura 1 muestra xọ,..., Xg como los puntos más grandes. Los puntos más pequeños son las 
ubicaciones de Xo,..., X100. La secuencia se encuentra sobre una órbita elíptica. A 


X 





X 


X 





xX 8 


7 
FIGURA 1 Iteración de un punto Xy 


por la acción de una matriz con un 
valor propio complejo. 


Desde luego, la figura 1 no explica por qué ocurre la rotación. El secreto de la rotación 
está oculto en las partes real e imaginaria de un vector propio complejo. 


Partes real e imaginaria de vectores 


El complejo conjugado de un vector complejo x en C” es el vector X en C” cuyas entradas 
están los complejos conjugados de las entradas en x. Las partes real e imaginaria de un 
vector complejo x son los vectores Re x e Im x en R” formados con las partes real e imagi- 
naria de las entradas de x. 


298 CAPÍTULO 5 Valores propios y vectores propios 


FIGURA 2 





Rez 


3—i 3 — 
EJEMPLO 4 Six= i =|0| +3 1 |; entonces 
2 +51 2 5 
3 —1 3 —1 3 +i 
Rex= | 0 |, Imx= 1 y xX=|0|-i 1 | = —i E 
2 5 2 5 2—5i 


Si B es una matriz de m x n con posibles entradas complejas, entonces B denota la matriz 
cuyas entradas son los complejos conjugados de las entradas en B. Las propiedades de conju- 
gados de números complejos son válidas también en álgebra matricial compleja: 





rx=rx, Bx=Bx BC=BC y rB=rB 


Valores propios y vectores propios de una matriz real 
que actúa sobre C” 


Sea A una matriz de n x n cuyas entradas son reales. Entonces, Ax = AX = AX. Si A es 
un valor propio de A y x su vector propio correspondiente en C”, entonces, 


Por lo tanto, A también es un valor propio de A, con X su vector propio correspondiente. 
Esto demuestra que cuando A es real, sus valores propios complejos se presentan en pares 
conjugados. (Aquí y en todas partes, se utiliza el término valor propio complejo para refe- 
rirse a un valor propio À = a + bi, con b + 0). 


EJEMPLO 5 Los valores propios de la matriz real del ejemplo 2 son complejos conju- 
gados; a saber, .8 — .61 y .8 + .61. Los vectores propios correspondientes que se encontraron 
en el ejemplo 2 también son conjugados: 


—2 — 4i —2 + 4i z 
v = 5 y v= 5 = V] E 


El siguiente ejemplo proporciona el “bloque básico” para todas las matrices reales de 
2 x 2 con valores propios complejos. 


EJEMPLO 6 SiC = i = | donde a y b son reales, pero no ambos cero, entonces 


los valores propios de C son A = a + bi. (Véase el problema de práctica al final de esta sec- 
ción). También, si r = |A| = Ya? + b?, entonces, 


C=r a/r —b/r _|[r 0|[cosp  —seng 

b/r afr 0 r || seng cos o 
donde ọ es el ángulo entre el eje x positivo y el rayo que pasa por el origen y por (a, b). 
Véase la figura 2 y el apéndice B. El ángulo ¢ se llama el argumento de À = a + bi. Por con- 


siguiente, la transformación x > Cx se puede ver como la composición de una rotación por 
un ángulo y y un escalamiento por |A| (véase la figura 3). E 


Finalmente, se está listo para descubrir la rotación que está oculta dentro de una matriz 
real que tiene un valor propio complejo. 
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x 
Escalamiento x 
A 
Axe 
` Rotación 
y Ko 


0 





FIGURA 3 Una rotación seguida por 
un escalamiento. 


5 —.6 —2— 4i 
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EJEMPLO 7 Sea A= ls al A=.8-.61 y v = | 5 | como en el 


ejemplo 2. También, sea P la matriz real de 2 x 2 


P = | Revi Im yv; | = E el 


y sea 


E 1f o 45 -6][-2 -4 8 —6 
= 1 SiS = 
ESE ap= zg[ E | 5 al È a 


Por el ejemplo 6, C es una rotación pura porque |A|? = (.8)? + (6)? = 1. De C = PAP, 


se obtiene 


B E E PE 
A= PCP =pl se 


¡Aquí está la rotación “dentro” de A! La matriz P proporciona un cambio de variable, por 
ejemplo, x = Pu. La acción de A equivale a un cambio de variable de x a u, seguido de una 
rotación y, después, de regreso a la variable original. Véase la figura 4. La rotación pro- 
duce una elipse, como en la figura 1, en vez de un círculo, ya que el sistema de coordenadas 
determinado por las columnas de P no es rectangular ni tiene longitudes unitarias idénticas 


sobre los dos ejes. 


=> === 


Cambio de pr P Cambio de 
variable variable 


u ÓÚúA Cu 
Rotación 


FIGURA 4 Rotación debida a un valor propio complejo. 


El siguiente teorema demuestra que los cálculos del ejemplo 7 se adaptan a cualquier 
matriz real de 2 x 2 que tenga un valor propio complejo A. La demostración utiliza el he- 
cho de que si las entradas de A son reales, entonces A(Re x) = Re Ax y A(Im x) = Im Ax, y 
six es un vector propio para un valor propio complejo, entonces Re x e Im x son linealmente 


independientes en [R?. (Véase los ejercicios 25 y 26). Se omiten los detalles. 


TEOREMA 9 Sea A una matriz real de 2 x 2 con un valor propio complejo A = a — bi(b + 0) y un 


vector propio asociado v en C?, Entonces, 


A=PCP-! donde P= [Rev Imv] y c=; A 
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FIGURA 5 

Iteraciones de dos puntos bajo 
la acción de una matriz de 3 x 3 
con un valor propio complejo. 


5.5 EJERCICIOS 


El fenómeno que se ilustra en el ejemplo 7 persiste en dimensiones más altas. Por ejem- 
plo, si A es una matriz de 3 x 3 con un valor propio complejo, entonces existe un plano en 
R? sobre el cual A actúa como una rotación (posiblemente combinada con escalamiento). 
Cada vector en ese plano se gira en otro punto sobre el mismo plano. Se dice que el plano es 
invariante bajo A. 


8—6 0 
EJEMPLO 8 La matriz A=|.6 .8 0 | tiene valores propios .8 + .6í y 1.07. 
0 0 1.07 


Cualquier vector wy en el plano xx, (con la tercera coordenada cero) es girado por A en 
otro punto del plano. Cualquier vector xy que no esté en el plano tiene su coordenada x3 mul- 
tiplicada por 1.07. En la figura 5 se presentan las iteraciones de los puntos wo = (2, 0, 0) y 
Xo = (2, 0, 1) con multiplicación por A. E 


PROBLEMA DE PRÁCTICA 
Demuestre que si a y b son reales, entonces los valores propios de A = i a | son a = bi, 


1 1 
con los vectores propios correspondientes | Li | y | i | 


En los ejercicios 1 a 6, cada matriz actúa sobre C?. Determine los 0 5 4 2 
; A i 2 15. 16. 
valores propios y una base para cada espacio propio en C4. —2 2 1 6 
1 -2 3 —3 
1. | | 2. | | —11 —4 3-5 
1 3 3. 3 17. 2 5 18. 2 5 
5 1 l -2 
3. | | 4. | | 1.52 —.7 -3 -8 
8 1 1 3 19. Ss 4 20. dos 
3 1 7 == . : y : 
5. 2 5 6. 1 3 21. En el ejemplo 2, despeje x, en la primera ecuación en (2) en 


En los ejercicios 7 a 12, utilice el ejemplo 6 para listar los valores 
propios de A. En cada caso, la transformación x > Ax es la composi- 
ción de una rotación y de un escalamiento. Determine el ángulo y de 


términos de xı, para de ahí producir el vector propio 
2 ; 
y= ls F ll para la matriz A. Demuestre que este y es 


un múltiplo (complejo) del vector y; utilizado en el ejemplo 2. 


la rotación, donde —77 < p <= Tr, así como el factor de escala de r. 


[4 


a 3 2] 


22. Sean A una matriz de n x n compleja (o real), y x en C” un 
vector propio correspondiente a un valor propio A en C. 


1 v3 -3v3 3 Demuestre que para cada escalar complejo u distinto de cero, 
š | 0 2 ] i | 0o 5 ] el vector ux es un vector propio de A. 
22. 0 SS 0 El capítulo 7 se enfocará en matrices con la propiedad A? = A. 
A 1 3 WE] Los ejercicios 23 y 24 demuestran que cada valor propio de dichas 
11. | E i sl 12. | 3 s 3 | matrices es necesariamente real. 

23. Sean A una matriz real de n x n tal que AT = A, x cualquier 
En los ejercicios 13 a 20, encuentre una matriz P invertible y una vector en C” y q = XĪAx. Las igualdades que se presentan a 
. a -b . continuación demuestran que q es un número real comprobando 

matriz C de la forma Ea tal que la matriz dada tenga la que q = q. Dé una razón para cada paso. 


forma A = PCP™!. 


1 3 





q=xX"Ax=x Ax =x'AXx =(xT AX"=x ATx=q 


13. E z 14. |; F | a) b) c) d) e) 


24. 


25. 


26. 


Sea A una matriz real de n x n con la propiedad AT = A. De- 
muestre que si Ax = Ax para algún vector x distinto de cero en 
C”, entonces, en efecto, À es real y la parte real de x es un vector 
propio de A. [Sugerencia: Calcule x7Ax, y utilice el ejercicio 23. 
Asimismo, examine las partes real e imaginaria de Ax]. 


Sean A una matriz real de n x n, y x un vector en C”. Demues- 

tre que Re(Ax) = A(Rex) y Im(4x) = A(Imx). 

Sea A una matriz real de 2 x 2 con un valor propio complejo 

A = a — bi (b + 0) y un vector propio asociado v en C?, 

a) Demuestre que A(Re v) = a Re v + b Im v y A(Im v) = 
—b Re v + a Im v. [Sugerencia: Escriba v = Re v + i Im v, 
y calcule Av]. 


b) Compruebe que si P y C están dadas como en el teorema 9, 
entonces AP = PC. 
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[M] En los ejercicios 27 y 28, encuentre una factorización de la ma- 
triz A dada en la forma A = PCP”!, donde C sea una matriz diagonal 
a bloques de 2 x 2 como se indica en el ejemplo 6. (Para cada par 
conjugado de valores propios, utilice las partes real e imaginaria de 
un vector propio en C* para crear dos columnas de P). 


26 33 23 20 
-6 -8 -i -13 

27. A=] i4 -19 -16 3 
—20 —20 -20 -14 

7 11 20 17 

—20 -40 -86 -74 

PS 0 -5 -10 -10 
10 28 60 53 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Recuerde que es fácil comprobar si un vector es un vector propio. No hay necesidad de exa- 
minar la ecuación característica. Calcule 


a [3 210 [319] <a ó0[1] 


1 
Así E es un vector propio correspondiente a A = a + bi. Del análisis en esta sección, 


1 ; a 5 i 
resulta que | i | debe ser un vector propio asociado con À = a — bi. 


5.6 | SISTEMAS DINÁMICOS DISCRETOS 


Los valores propios y vectores propios ofrecen la clave para entender el comportamiento 
a largo plazo, o evolución, de un sistema dinámico descrito por una ecuación en diferen- 
clas Xz+1 = AX. Dicha ecuación se utilizó en la sección 1.10 para modelar el movimiento 
de población; en la sección 4.9, varias cadenas de Markov; y en el ejemplo introducto- 
rio de este capítulo, la población de búhos manchados. Los vectores x dan información 
acerca del sistema conforme transcurre el tiempo (que se denota con k). En el caso de los 
búhos manchados, por ejemplo, X% listó el número de búhos en tres clases de edades al 
tiempo k. 

En esta sección las aplicaciones se enfocan sobre problemas ecológicos, ya que son 
más fáciles de plantear y de explicar que, por ejemplo, problemas de física o de ingeniería. 
Sin embargo, los sistemas dinámicos se originan en muchos campos científicos. En cursos 
estándar de licenciatura de sistemas de control se estudian diversos aspectos de sistemas 
dinámicos. En tales cursos el método moderno de diseño del espacio de estados se basa sig- 
nificativamente en álgebra de matrices.! La respuesta de estado estable de un sistema de 
control es el equivalente en ingeniería de lo que aquí se denomina “comportamiento a largo 
plazo” del sistema dinámico Xz+1 = AXz. 


1 Véase G. F. Franklin, J. D. Powell y A. Emami-Naeimi, Feedback Control of Dynamic Systems, 5a. ed. (Upper 
Saddle River, NJ: Prentice-Hall, 2006). Este texto tiene una excelente introducción a modelos dinámicos (cap.2). 
Los capítulos 7 y 8 tratan el diseño del espacio de estados. 
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Hasta el ejemplo 6, se supone que A es diagonalizable con n vectores propios lineal- 
mente independientes, V1,..., Vn, y sus valores propios correspondientes À1,..., Àn. Por 
conveniencia, se supone que los vectores propios están arreglados de tal manera que 
21] > |A2] > --- > [A]. Puesto que (v;,..., v,) es una base para [R”, entonces cualquier vec- 
tor inicial xy se puede escribir unívocamente en la forma 


Xo = C1V1 ++** + CpVn O) 


Esta descomposición de vectores propios de Xy determina lo que sucede a la secuencia {x4}. 
El siguiente cálculo generaliza el caso simple examinado en el ejemplo 5 de la sección 5.2. 
Como los v; son vectores propios 
Xı = AXoy =C¡AV¡ +++: +C, AV 
= CIA1V1 +=: + CrAnVn 


En general, 
Xk = (A) Vi He H Cn An) Yn (e =0,1,2,...) (2) 


Los siguientes ejemplos ilustran qué sucede en (2) conforme k > o, 


Un sistema depredador-presa 


En lo profundo de los bosques de secuoyas en California, las ratas de bosque de patas oscu- 
ras suministran el 80% de la dieta de los búhos manchados, el principal depredador de esos 
roedores nocturnos. El ejemplo 1 utiliza un sistema dinámico lineal para modelar el sistema 
físico de los búhos y las ratas. (Hay que admitir que aunque el modelo no es realista en varios 
aspectos, puede dar el punto de partida para el estudio de modelos no lineales más complica- 
dos utilizados por científicos ambientales). 


EJEMPLO 1  Denote las poblaciones de búhos y ratas de bosque al tiempo k por el 

vector X% = | en | donde k es el tiempo en meses, O; es el número de búhos en la región 
k 

bajo estudio y R; es el número de ratas (medido en miles). Suponga que 


Ok+1 = (.5) Ok + (.4)Rk 


G) 
Rk+ı = —p: Ok + (1.1)Rk 


donde p es un parámetro positivo que se debe especificar. (.5)O; en la primera ecuación 
indica que si no hay ratas para alimentarse, entonces cada mes sobreviviría tan solo la mi- 
tad de los búhos; mientras que (1.1)R; en la segunda ecuación implica que sin los búhos como 
depredadores, la población de ratas crecería 10% cada mes. Si las ratas son abundantes, (.4) 
Ry hará que crezca la población de búhos, en tanto que el término negativo —p : Ox mide las 
muertes de ratas por la depredación de los búhos. (En efecto, 1000p es el número promedio 
de ratas devoradas por un búho en un mes). Determine la evolución de este sistema, cuando el 
parámetro de depredación p es .104. 


SOLUCIÓN Cuando p = .104, los valores propios de la matriz de coeficientes A para las 
ecuaciones (3) resultan ser A; = 1.02 y A¿= .58. Los vectores propios correspondientes son 


s[e eE 


Un vector inicial xy se escribe como Xy = c1V1 + c2v2. Entonces, para k = 0, 





Xk = cı(1.02)*v; + c(.58) 
a ¿[10 Ts 
= c1(1.02) | A + c2(.58) | al 
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Conforme k > %, entonces (.58)' rápidamente se aproxima a cero. Suponga que c, > 0. 
Por lo tanto, para toda k suficientemente grande, x, es aproximadamente igual a c,(1.02)v,, 
y se escribe 


XxX; = T A (4) 


La aproximación en (4) mejora conforme k se incrementa, y así para k grandes, 


Xk+ Y ao] al = | e] = 1.02xz (5) 


La aproximación en la ecuación (5) indica que a final de cuentas ambas entradas de xz (los 
números de búhos y ratas) crecerán por un factor de casi 1.02 cada mes, un 2% de tasa de 
crecimiento mensual. Por (4), x, es aproximadamente un múltiplo de (10, 13), de manera que 
las entradas en x, están casi en la misma razón de 10 a 13. Es decir, por cada 10 búhos hay 
cerca de 13 mil ratas. E 


El ejemplo 1 muestra dos hechos generales acerca de un sistema dinámico Xz+1 = AXg 
donde A es n x n, sus valores propios satisfacen |A| = 1 y 1 > |A] para j = 2,..., n y vı es 
un vector propio correspondiente a A¡. Si xy está dado por la ecuación (1), con c¡ + 0, enton- 
ces para todas las k suficientemente grandes, 


Xk+1 % À1Xk (6) 


x= ca), (7) 


Las aproximaciones en (6) y (7) se pueden volver tan cercanas como se desee tomando una 
k muy grande. Por (6), xz finalmente crecerá casi por un factor de A; cada vez, de manera 
que A: determina la eventual tasa de crecimiento del sistema. Asimismo, por (7), la razón de 
cualesquiera dos entradas en x; (para k grande) es casi la misma que la razón de las entradas 
correspondientes en v1. En el ejemplo 5 de la sección 5.2, se ilustra el caso donde A; = 1. 


Descripción gráfica de soluciones 


Cuando A es una matriz de 2 x 2, los cálculos algebraicos se complementan con una descrip- 
ción geométrica de la evolución del sistema. La ecuación Xx; +1 = AX se puede considerar una 
descripción de qué sucede al punto inicial xy en [R?, conforme se transforma repetidamente 
por el mapeo x > Ax. La gráfica de Xp, x;,... es la trayectoria del sistema dinámico. 


EJEMPLO 2  Grafique varias trayectorias del sistema dinámico x;+1 = AX, cuando 
.80 0 
A | 0 el 
SOLUCIÓN Los valores propios de A son .8 y .64, con vectores propios v¡ = lo! y 


0 ; 
Y) = l . Si Xọ = cC1V1 + c2v2, entonces, 


Xk = acfa] + cacon! [| 


Desde luego, Xy tiende a 0 porque (.8)* y (.64)* se aproximan a O conforme k > œ. No obstan- 
te, resulta interesante la manera en que xx va hacia 0. La figura 1 (en la página 304) muestra 
los primeros términos escasos de varias trayectorias que empiezan en puntos sobre la frontera 
de la caja con vértices en (+3, +3). Los puntos sobre cada trayectoria están conectados por 
una curva delgada, para que así la trayectoria sea más fácil de observar. E 
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FIGURA 1 El origen como un atractor. 


En el ejemplo 2, al origen se le denomina atractor del sistema dinámico porque todas 
las trayectorias tienden hacia 0. Esto ocurre siempre que ambos valores propios sean menores 
que 1 en magnitud. La dirección de la atracción más grande está a lo largo de la recta que pasa 
por 0 y el vector propio vaz para el valor propio de menor magnitud. 

En el siguiente ejemplo, ambos valores propios de A son mayores que 1 en magnitud, y 0 
es un repulsor del sistema dinámico. Todas las soluciones de xx+1 = Ax; excepto la solución 
cero (constante), no están acotadas y tienden a alejarse del origen.? 


EJEMPLO 3  Grafique varias soluciones típicas de la ecuación Xz+1 = AXz, donde 
1.44 0 
S | 0 dal 


SOLUCIÓN Los valores propios de A son 1.44 y 1.2. Si xy = E 


, entonces, 
C2 


Xx; = cr.) | + e | 


Ambos términos aumentaron en tamaño, pero el primer término lo hizo más rápido. Así, la 
dirección de la mayor repulsión es la recta que pasa por 0 y por el vector propio para el valor 
propio de magnitud más grande. La figura 2 muestra varias trayectorias que inician en puntos 
muy cercanos a 0. E 

En el siguiente ejemplo, 0 es un punto silla porque el origen atrae soluciones de algunas 
direcciones y las repele en otras direcciones. Esto ocurre siempre que un valor propio sea 
más grande que 1 en magnitud y el otro sea menor que 1 en magnitud. La dirección de ma- 
yor atracción está determinada por un vector propio del valor propio de menor magnitud. La 
dirección de la mayor repulsión se determina mediante un vector propio del valor propio de 
magnitud más grande. 


2 El origen es el único posible atractor o repulsor en un sistema dinámico lineal, aunque podrían existir múltiples 
atractores y repulsores en un sistema dinámico más general para el cual el mapeo x¿ > Xz+1 no es lineal. En tal sis- 
tema, los atractores y los repulsores están definidos en términos de los valores propios de una matriz especial (con 
entradas variables) llamada matriz jacobiana del sistema. 
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FIGURA 2 El origen como un repulsor. 


EJEMPLO 4  Grafique varias soluciones típicas de la ecuación yx +1 = Dyz, donde 


20 0 
pal 0 A 


(Aquí se usaron D y y en vez de A y x porque este ejemplo se utilizará más adelante). Demues- 
tre que una solución {yz} no está acotada, cuando su punto inicial no está sobre el eje x2. 


SOLUCIÓN Los valores propios de D son 2 y 0.5. Si Yọ = E | entonces, 
2 


Y, = atls] + ey | (8) 


Si yo está sobre el eje x2, entonces c; = O y y¿ > 0 conforme k > o, Pero si yg no se encuen- 
tra sobre el eje x2, entonces el primer término en la suma para y; se vuelve arbitrariamente 
grande y, por lo tanto, (yz) no está acotada. La figura 3 presenta diez trayectorias que inician 
cerca del eje x, o sobre este. E 


X 





X 


X 


X 





FIGURA 3 El origen como un punto silla. 
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Cambio de variable 


Los tres ejemplos anteriores implicaron matrices diagonales. Para tratar el caso no diagonal, 
regrese por un momento al caso n x n donde los vectores propios de A forman una base 
[v1,..., Vn) para R”. Sean P = [v1 ++} va], y D la matriz diagonal con los valores propios co- 
rrespondientes sobre la diagonal. Dada una secuencia {x} que comprueba xg+1 = AXx, defina 
una nueva secuencia {y4} mediante 


Yk = P™'xų 0, de manera equivalente, Xx; = Pyk 


Sustituyendo esas relaciones en la ecuación Xz+1 = AX; y utilizando que A = PDP”|, se 
tiene que 
PYx+1 = APy, = (PDP"*) Py, = PDy, 


Se multiplican ambos lados por la izquierda por P~! y se obtiene 


Yk+1 = DJk 
Si se escribe yz como y(k) y se denotan las entradas en y(k) por y1(k),..., yn(k), entonces, 
yr (k + 1) AL 0O > 0 yı (k) 
nk+D|_ |0 % : || z% 
: ; Sna Â : 
Yn(k + 1) O > 0 An] CCK) 


El cambio de variable de x, a y; ha desacoplado el sistema de ecuaciones en diferencias. 
La evolución de y,(k), por ejemplo, no se ve afectada por lo que suceda a ya(k),..., yn(k), 
porque y¡(k + 1) = Ay : y¡(k) para cada k. 

La ecuación x; = Py indica que y, es el vector de coordenadas de x¿ con respecto a la 
base de vectores propios [v;,..., V,). Se puede desacoplar el sistema Xz+1 = AXz efectuando 
cálculos en el nuevo sistema de coordenadas de vectores propios. Cuando n = 2, esto equivale 
a emplear papel para graficar con ejes en las direcciones de los dos vectores propios. 


EJEMPLO 5 Demuestre que el origen es un punto silla para las soluciones de 


Xx+1 = ÁX, donde 
125 —.75 
Ae e A 


Encuentre las direcciones de mayor atracción y de mayor repulsión. 

SOLUCIÓN Utilizando técnicas estándar, se determina que los valores propios de A son 
; ? 1 ; 

2 y .5, con los vectores propios correspondientes vı = E | y Yo = | 1 | respectivamen- 


te. Como |2| > 1 y |.5] < 1, entonces el origen es un punto silla del sistema dinámico. Si 
Xy = C1V1 + C2V2, 
x= 0121 + ca(.5) (9) 


Esta ecuación se ve exactamente igual que la ecuación (8) del ejemplo 4, con vı y v2 en lugar 
de la base estándar. 

Sobre el papel para graficar, dibuje ejes a través de 0 y de los vectores propios vi y vz. 
Véase la figura 4. El movimiento a lo largo de los ejes corresponde al movimiento sobre los 
ejes estándar de la figura 3. En la figura 4, la dirección de mayor repulsión es la recta que 
pasa por 0 y el vector propio v; cuyo valor propio es mayor que 1 en magnitud. Si xy está 
sobre esta recta, cz de la ecuación (9) es cero y xy se aleja rápidamente de 0. La dirección 
de mayor atracción está determinada por el vector propio vz cuyo valor propio es menor que 
1 en magnitud. 

En la figura 4 se ilustra un número de trayectorias. Cuando esta gráfica se observa en 
términos de los ejes de vectores propios, el esquema “parece” en esencia igual que el esquema 
de la figura 3. E 
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X3 Xi x 








FIGURA 4 El origen como un punto silla. 


Valores propios complejos 


Cuando una matriz real A de 2 x 2 tiene valores propios complejos, entonces A no es dia- 
gonalizable (cuando actúa sobre R?), pero el sistema dinámico Xķ+ı = Ax; es fácil de des- 
cribir. El ejemplo 3 de la sección 5.5 ilustró el caso donde los valores propios tienen valor 
absoluto 1. La iteración de un punto xy giró alrededor del origen con una trayectoria elíptica. 

Si A tiene dos valores propios complejos cuyo valor absoluto es mayor que 1, entonces 
0 es un repulsor y la iteración de xy girará en espiral hacia fuera en torno al origen. Si los 
valores absolutos de los valores propios complejos son menores que 1, entonces el origen es 
un atractor y la iteración de xy da una espiral hacia adentro acercándose al origen, como en 
el siguiente ejemplo. 


EJEMPLO 6 Se puede comprobar que la matriz 
8 0.5 
2 E E 


tiene valores propios .9 + .2í, con vectores propios | l e | La figura 5 (en la página 


308) muestra tres trayectorias del sistema X;+1 = AXz, con vectores iniciales | 2 F o 
0 
y al s 


Supervivencia de los búhos manchados 


Recuerde del ejemplo introductorio de este capítulo que la población de búhos manchados en 
el área Willow Creek, California, se modeló con un sistema dinámico X;+1 = AXz donde las 
entradas en x; = (jk, Sk, ak) listaban los números de hembras (al tiempo k) en las etapas de vida 
juvenil, subadulto y adulto, respectivamente, y A es la matriz de etapas 


0 0 33 
A=|.18 0 0 (10) 
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FIGURA 5 Rotación asociada con valores propios 


complejos. 
MATLAB muestra que los valores propios de A son aproximadamente A, = .98, 
A = —.02 + .21i y A3 = —.02 — .21í. Observe que los tres valores propios son menores 


que 1 en magnitud, ya que |A2/? = | 13]? = (-.02? + (21)? = 0.445. 

Por el momento, deje que A actúe sobre el espacio vectorial complejo C”. Puesto que 
A tiene tres valores propios distintos, entonces los tres vectores propios correspondientes 
son linealmente independientes y forman una base para C*. Denote los vectores propios 
con vi, V2 y V3. Así, la solución general de x;+1 = AX; (utilizando vectores en C?) tiene la 
forma 





Xk = c1 (A1)Ž vi + c2(å2)#v2 + c3(43)*v3 (11) 


Si Xp es un vector inicial real, entonces x; = AXo es real porque A es real. Asimismo, la 
ecuación X¿+1 = AXz indica que cada x¿ en el miembro izquierdo de la ecuación (11) es real, 
aun cuando se expresa como una suma de vectores complejos. Sin embargo, cada término 
en el miembro derecho de la ecuación (11) se aproxima al vector cero, ya que todos los va- 
lores propios son menores que 1 en magnitud. Por lo tanto, la secuencia real x también tiende 
al vector cero. Tristemente, este modelo predice que, a final de cuentas, perecerán todos los 
búhos. 

¿Hay alguna esperanza para los búhos manchados? Recuerde del ejemplo introductorio 
que la entrada de 18% en la matriz A de la ecuación (10) es porque, no obstante que el 60% de 
los búhos juveniles sobreviven lo suficiente para dejar el nido y buscar nuevas áreas de distri- 
bución, tan solo el 30% de ese grupo sobrevive a dicha búsqueda y encuentra un nuevo hogar. 
La supervivencia a la mencionada búsqueda está significativamente influida por el número de 
áreas deforestadas en el bosque, lo cual vuelve más difícil y peligrosa esa búsqueda. 

Algunas poblaciones de búhos habitan en zonas con pocas o ninguna área deforesta- 
da. Quizás un porcentaje aún mayor de búhos juveniles sobrevivan ahí y encuentren nuevos 
territorios. De hecho, el problema del búho manchado es más complicado que como se ha 
expuesto, no obstante que el ejemplo final da un final feliz a la historia. 


EJEMPLO 7 Suponga que la tasa de supervivencia a la búsqueda, de los búhos juveniles, 
sea de 50%, de manera que la entrada (2, 1) de la matriz por etapas (de estados) A en (10) es 
.3 en vez de .18. ¿Qué predice el modelo de la matriz por etapas acerca de la población de 
búhos manchados? 


SOLUCIÓN Ahora los valores propios de A resultan ser aproximadamente à; = 1.01, 
A = —.03 + .26i y Az = —.03 — .26i. Un vector propio para A, es aproximadamente 
vı = (10, 3, 31). Sean v, y v3 vectores propios (complejos) para A, y A3. En este caso, la 
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ecuación (11) se convierte en 
xk = cı (1.01)*v; + c2(—.03 + .26i)* v2 + c3(—.03 — .26i)* v3 


Cuando k — «o, el segundo de los dos vectores tiende a cero. Así, x, se vuelve cada vez más 
semejante al vector (real) c1(1.01)y¡. Las aproximaciones aplicadas en (6) y (7) provienen 
del ejemplo 1. Además, se puede demostrar que la constante c¡ en la descomposición ini- 
cial de xy es positiva cuando las entradas en xy son no negativas. Entonces, la población de 
búhos crecerá lentamente, con una tasa de crecimiento asintótica de 1.01. El vector propio v; 
describe la distribución final de los búhos en sus etapas de vida: por cada 31 adultos, habrá 
10 juveniles y 3 subadultos. E 
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PROBLEMAS DE PRÁCTICA 


$ ; a i : 2 1 
1. La matriz A que se muestra a continuación tiene los valores propios 1, 3 y 3 con los 
vectores propios correspondientes vi, Va y V3: 


1 1-2 0 —2 2 1 

A=-]| -2 6 2 ‘> Y= ť> H= 1 » v= 2 

| o 2 5 1 -2 
1 
Encuentre la solución general de la ecuación Xz+1 = ÁXk si Xo = | 11 
—2 


2. ¿Qué ocurre en la secuencia {xz} del problema de práctica 1, conforme k —> œ? 


5.6 EJERCICIOS 


1. Sea A una matriz de 2 x 2 con valores propios 3 y 1/3, y vec- 2. Suponga que los valores propios de A de 3 x 3 son 3, 4/5 y 
; . 1 -1 
tores propios correspondientes V; = | 3 y Vo = | il Sea l 2 
3/5, con sus vectores propios correspondientes 0|, 1 
{x;} una solución de la ecuación en diferencias X+; = AÅX%, —3 =5 
ws E -3 = 
1 a 
y | -—3 |. Sea xo = | —5 |. Encuentre la solución de la ecua- 
a) Calcule x; = Axo. [Sugerencia: No se necesita conocer A]. 7 3 
b) Determine una fórmula para x que implique k y los vectores ción Xz+1 = Axz para Xp especificado, y describa qué sucede 


propios vı y V2. cuando k > 00, 
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En los ejercicios 3 a 6, suponga que cualquier vector inicial xy tiene 
una descomposición de vectores propios tal que el coeficiente c,, en 
la ecuación (1) de esta sección, es positivo.* 


3. Determine la evolución del sistema dinámico del ejemplo 1, 
cuando el parámetro de depredación p es .2 en la ecuación (3). 
(Dé una fórmula para Xy). ¿Crece o disminuye la población 
de búhos? ¿Qué se puede decir sobre la población de ratas de 
bosque? 


4. Determine la evolución del sistema dinámico del ejemplo 1, 
cuando el parámetro de depredación p es .125. (Dé una fórmu- 
la para x4). Conforme el tiempo transcurre, ¿qué ocurre a los 
tamaños de las poblaciones de búhos y de ratas bosque? El sis- 
tema tiende hacia lo que algunas veces se denomina equilibrio 
inestable. ¿Qué piensa que pueda ocurrirle al sistema si algún 
aspecto del modelo (como las tasas de nacimiento o de depre- 
dación) cambiara ligeramente? 


5. En los antiguos bosques de abetos en Douglas, los búhos 
manchados cenan básicamente ardillas voladoras. Suponga 
que la matriz depredador-presa para esas dos poblaciones es 


a=| 4 
=p 


dación p es .325, entonces ambas poblaciones crecen. Estime 
la tasa de crecimiento a largo plazo y la proporción final entre 
búhos y ardillas voladoras. 


a | Demuestre que si el parámetro de depre- 


6. Demuestre que si el parámetro de depredación p del ejercicio 
5 es .5, entonces a final de cuentas desaparecerán tanto los bú- 
hos como las ardillas. Encuentre un valor de p para el cual am- 
bas poblaciones tienden a mantener niveles constantes. En este 
caso, ¿cuál es la proporción entre las dos poblaciones? 


7. Sea que A tiene las propiedades descritas en el ejercicio 1. 
a) ¿El origen es un atractor, un repulsor, o un punto silla del 
sistema dinámico Xz+] = ÁX? 
b) Encuentre las direcciones de mayor atracción y/o repulsión 
para este sistema dinámico. 


c) Haga una descripción gráfica del sistema, que indique las 
direcciones de mayor atracción o repulsión. Incluya un es- 
quema de varias trayectorias típicas (sin calcular puntos 
específicos). 


8. Determine la naturaleza del origen (atractor, repulsor o punto 
silla) para el sistema dinámico Xz+1 = AX; si A tiene las pro- 
piedades descritas en el ejercicio 2. Obtenga las direcciones 
de mayor atracción o repulsión. 


En los ejercicios 9 a 14, clasifique el origen como atractor, repulsor 
o punto silla del sistema dinámico x;+1 = Axz. Encuentre las direc- 
ciones de mayor atracción y/o repulsión. 
3 .4 
=3 1.1 


1.7 —3 
” tea J 


3 Una de las limitaciones del modelo del ejemplo 1 es que ahí siempre existen 


10. a=| 


vectores Xy de población inicial con entradas positivas, tales que el coeficiente 
c¡ es negativo. La aproximación (7) aún es válida, pero las entradas en Xz 
finalmente se vuelven negativas. 


11. 


13. 


15. 


16. 


17. 


18. 


3) | 
[33] +5 


4 0 .2 1 
Sea A= | .3 .8  .3 |. El vector v; = | .6 | es un vector 
A) 3 


propio de A, y dos valores propios son .5 y .2. Construya 
la solución del sistema dinámico Xz+1 = AX, que satisface 
Xo = (0, .3, .7). ¿Qué sucede a x; conforme k > 00? 


[M] Obtenga la solución general del sistema dinámico Xx+1 = 
Ax; cuando A es la matriz estocástica para el modelo Rent A Car 
de Hertz del ejercicio 16 de la sección 4.9. 


Construya un modelo matricial por etapas para una especie ani- 
mal que tiene dos etapas de vida: juvenil (hasta 1 año de edad) 
y adulto. Suponga que las hembras adultas cada año dan a luz 
a un promedio de 1.6 hembras juveniles. Cada año, el 30% de 
las hembras juveniles sobreviven para convertirse en adultos y 
el 80% de los adultos sobreviven. Para k = 0, sea Xy = (jk, ap), 
donde las entradas en x, son los números de hembras juveniles 
y hembras adultas en el año k. 


a) Construya la matriz por etapas A tal que Xz+1 = AXx para 
k=0. 


b) Demuestre que la población está creciendo, calcule la tasa 
de crecimiento final de la población y dé la razón final entre 
adultos y juveniles. 


c) [M] Suponga que inicialmente hay 15 hembras juveniles y 
10 hembras adultas en la población. Elabore cuatro gráfi- 
cas que muestren cómo cambia la población durante 8 años: 
a) el número de juveniles, b) el número de adultas, c) la po- 
blación total y d) la razón entre adultas y juveniles (cada 
año). ¿Cuándo parece estabilizarse la razón en d)? Incluya 
una lista del programa o las instrucciones empleadas para 
realizar las gráficas en c) y d). 


Una manada de búfalos americanos (bisontes) se podría mode- 
lar con una matriz por etapas, similar a la empleada para los 
búhos manchados. Las hembras se pueden dividir en terneras 
(hasta 1 año de edad), becerras (de 1 a 2 años) y adultas. Supon- 
ga que un promedio de 42 hembras terneras nacen cada año 
por cada 100 adultas. (Tan solo las adultas tienen descendencia). 
Cada año sobreviven cerca del 60% de terneras, 75% de bece- 
rras y 95% de adultas. Para k = 0, sea x = (Cx, yx, Ax), donde 
las entradas en x, son los números de hembras en cada etapa 
de vida en el año k. 


a) Construya la matriz por etapas A para la manada de búfalos, 
tal que X¿+1 = Ax; parak = 0. 


b) [M] Demuestre que la manada de búfalos está creciendo, 
determine la tasa de crecimiento esperada después de mu- 
chos años, y dé los números esperados de terneras y becerras 
por cada 100 adultas. 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. El primer paso consiste en escribir xy como una combinación lineal de v;, v2 y v3. 
La reducción por filas de [v; v2 v3 Xp] genera los pesos cı = 2, c2 = 1 y c3 = 3, 
tal que 


Xo = 2v1 + 1v2 + 3v3 


y 2.1 E 
Como los valores propios son 1, 3 y 3, la solución general es 


k k 
k 2 1 
x= 201804125) 9 +3: (3) v3 


=2 ay 2 yk 1 
=2| 2|+ (5) 1 |+3- (5) 2 (12) 
1 > E IE 
2. Conforme k — %, el segundo y tercer términos en (12) tienden al vector cero, y 


ak yk —4 
x=20 + (5) 1 +3 (5) v — 2v = 4 
2 


5.7 | APLICACIONES A ECUACIONES DIFERENCIALES 


Esta sección describe análogos continuos de las ecuaciones en diferencias estudiadas en la 
sección 5.6. En muchos problemas aplicados, algunas cantidades varían continuamente en el 
tiempo, y se relacionan mediante un sistema de ecuaciones diferenciales: 


1 

X1 = 411X11 +++ + ainXn 
$ 

X) = 021X1 +-*** + 02nXn 


F 
Xy = An1X1 + -*- + GnnXn 


Aquí xj,..., Xn son funciones diferenciables de £, con derivadas xi Ta Xi y las aj; son cons- 
tantes. El aspecto esencial de este sistema es que es lineal. Para observarlo, escriba el siste- 
ma como una ecuación diferencial matricial 


x'(1) = Ax(t) (1) 
donde 
x1(t) xi (t) au > An 
x(t) = : , X()= y A=| : 
Xn(t) x! (t) An ° am 


Una solución de la ecuación (1) es una función valuada en vectores que satisface la ecuación 
(1) para toda f en algún intervalo de números reales, tales como f = 0. 

La ecuación (1) es lineal porque la derivación de funciones y la multiplicación de 
vectores por una matriz son transformaciones lineales. Así, cuando u y v son soluciones 
de x’ = Ax, entonces cu + dv también es una solución, porque 


(cu + dvY = cul + dv 
= cAu + dAv = A(cu + dv) 
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(A esta propiedad los ingenieros la denominan superposición de soluciones). Asimismo, la 
función idénticamente cero es una solución (trivial) de (1). En la terminología del capítulo 4, 
el conjunto de todas las soluciones de (1) es un subespacio del conjunto de todas las funciones 
continuas con valores en R”. 

Los libros estándar de ecuaciones diferenciales demuestran que siempre existe el con- 
junto fundamental de soluciones de (1). SiA es n x n, entonces hay n funciones linealmente 
independientes en un conjunto fundamental, y cada solución de (1) es una combinación lineal 
única de tales n funciones. Es decir, un conjunto fundamental de soluciones es una base para 
el conjunto de todas las soluciones de (1), y el conjunto solución es un espacio vectorial 
n-dimensional de funciones. Si se especifica un vector xp, entonces el problema con valores 
iniciales consiste en construir la función (única) x tal que x” = Ax y x(0) = Xo. 

Cuando A es una matriz diagonal, las soluciones de (1) se generan mediante cálculo 
elemental. Por ejemplo, considere 


x(t) = 3 Oj x) o 
x5(t) 0 —=5 xa (t) 


xi) 


es decir, 


3x1 (t) 
—5x2(t) 


6) 
x2 (1) 


Se dice que el sistema (2) está desacoplado porque cada derivada de una función tan solo 
depende de la propia función, y no de alguna combinación o “acoplamiento” de x1(1) y x2(1). 
De cálculo, las soluciones de (3) son x,(t) = ce” y x2(t) = cre” *, para las constantes cuales- 
quiera c1 y c2. Cada solución de la ecuación (2) se escribe en la forma 


al ae. 1] O| z 
Ea = Eo =C1 0 e +c 1 e 
Este ejemplo sugiere que para la ecuación general x” = Ax, una solución podría ser una 
combinación lineal de funciones con la forma 
x(t) = ve" (4) 


para algún escalar A y algún vector fijo v distinto de cero. [Si v = 0, la función x(1) es idén- 
ticamente cero y por lo tanto satisface x’ = Ax]. Observe que 


x'(1) = AveN Por Cálculo, ya que v es un vector constante 
Ax(t) = Ave Multiplicando ambos lados de (4) por A 
Como e” nunca es cero, x'(£) será igual a Ax(2) si y solo si Av = Av, es decir, si y solo si A 


es un valor propio de A y v es un vector propio correspondiente. Así, cada par valor propio- 
vector propio ofrece una solución (4) de x' = Ax. Algunas veces dichas soluciones se conocen 
como funciones propias de la ecuación diferencial. Las funciones propias dan la clave para 
resolver sistemas de ecuaciones diferenciales. 


EJEMPLO 1 El circuito de la figura 1 se describe con la ecuación diferencial 


x, (6) e =(1/R¡ + 1/R>)/C; 1/(R>C;) x(t) 
x(t) 1/(R2C2) —1/(R2C2) | | x2(t) 


donde x(t) y x2(t) son los voltajes en los dos capacitores al tiempo t. Suponga que el resis- 
tor R¡ es de 1 ohm, R? = 2 ohms, capacitor Cı = 1 farad, y C2 = .5 farad; con cargas inicia- 
les de 5 volts en el capacitor C¡ y de 4 volts en C7. Encuentre las fórmulas para x1(t) y x2(£) 
que describan cómo los voltajes cambian en el tiempo. 
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SOLUCIÓN Sea que A denote la matriz mostrada arriba y sea x(t) = e | Para los 
2 


-1.5 .5 
1 -=l 


A2 = —2, con los vectores propios correspondientes 


ello E 


Ambas funciones propias xı (t) = vie! y x(t) = ve?” satisfacen x’ = Ax, y lo mismo 
ocurre con cualquier combinación lineal de xı y x2. Se hace 


x(t) = cve?! + cve” = afa e + o|- Je 


datos dados, A = | | y x(0) = 5 Los valores propios de A son à; = —.5 y 


y Observe que x(0) = c¡v¡ + c2v2. De manera evidente, puesto que v¡ y v2 son linealmente 
independientes y por consiguiente generan R?, c, y cz se determinan tal que x(0) sea igual 


a Xo. En efecto, la ecuación 
1 —1 5 
A 


t 1 $ 


Vi V2 Xo 


conduce fácilmente a c} = 3 y c2 = —2. Por lo tanto, la solución deseada de la ecuación 


diferencial x” = AXx es 
SE 
o=; k 2 ¡je 


al 3e7% 4 202 


o bien, 


xo(t) E 6e7 5 5 2e7? 


La figura 2 muestra la gráfica, o trayectoria, de x(t), para t = 0, junto con trayectorias para 
algunos otros puntos iniciales. Las trayectorias de las dos funciones propias X; y X? están en 
los espacios propios de A. 

Las funciones X¡ y X2 decaen a cero cuando £ > %, pero los valores de x2 decrecen más 
rápido porque su exponente es más negativo. Las entradas en el vector propio correspondien- 
te v2 muestran que los voltajes en los capacitores decaerán a cero tan rápido como sea posi- 
ble, si los voltajes iniciales son iguales en magnitud pero opuestos en signo. E 


4+ 


vV 





FIGURA 2 Fl origen como un atractor. 
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En la figura 2, el origen es un atractor o sumidero del sistema dinámico porque todas 
las trayectorias caen al origen. La dirección de mayor atracción está sobre la trayectoria de la 
función propia Xx, (a lo largo de la recta que pasa por Ó y v,) correspondiente al valor propio 
más negativo, A = —2. Las trayectorias que inician en puntos fuera de esta recta se convierten 
en asíntotas a la recta que pasa por 0 y vı, ya que sus componentes en la dirección vz decaen 
muy rápidamente. 

Si los valores propios del ejemplo 1 fueran positivos en vez de negativos, las trayectorias 
correspondientes serían similares en forma, aunque las trayectorias estarían alejándose del 
origen. En tal caso, el origen es un repulsor, o fuente, del sistema dinámico, y la dirección 
de mayor repulsión es la recta que contiene la trayectoria de la función propia asociada con 
el valor propio más positivo. 


EJEMPLO 2 Suponga que una partícula se mueve en un campo de fuerza plano y que su 
vector de posición x satisface x” = AX y x(0) = xo, donde 


4 —5 2.9 
TE X v=|3] 


Resuelva este problema de valor inicial para £ = 0, y bosqueje la trayectoria de la partícula. 


SOLUCIÓN Los valores propios de A resultan ser A, = 6 y A2 = — 1, con los vectores propios 
correspondientes vı = (—5, 2) y v2 = (1, 1). Para cualesquiera constantes cı y c2, la función 


= 1 
x(1) = civie*" + 02,0% = al e + ol 1 l- 


es una solución de x” = Ax. Se requiere que c, y c, satisfagan x(0) = xq, es decir, 


2 Jrl]=Ls > E 


Los cálculos demuestran que c; = —3/70 y cz = 188/70, y así la función deseada es 
A e BT 
x= 5 | ¿je o Lle 
En la figura 3 se ilustran las trayectorias de x y otras soluciones. E 


En la figura 3, el origen es un punto silla del sistema dinámico porque algunas tra- 
yectorias primero se acercan al origen y, después, cambian de dirección y se alejan de él. 
Un punto silla se presenta cuando la matriz tiene valores propios tanto positivos como nega- 
tivos. La dirección de mayor repulsión es la recta que pasa por vı y 0, asociada con el valor 
propio positivo. La dirección de mayor atracción es la recta que pasa por v2 y 0, correspon- 
diente al valor propio negativo. 








FIGURA 3 El origen como un punto silla. 
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Desacoplamiento de un sistema dinámico 


El siguiente análisis muestra que el método de los ejemplos 1 y 2 produce un conjunto fun- 
damental de soluciones para cualquier sistema dinámico descrito por x’ = Ax cuando A es de 
n x n y tiene n vectores propios linealmente independientes, es decir, cuando A es diagona- 
lizable. Suponga que las funciones propias para A son 


Àit Ànt 


vie ero Neta 


con vj,..., V, Vectores propios linealmente independientes. Sean P = [v; *** v,] y D la matriz 


diagonal con entradas Aj,..., A, tal que A = PDP”!, Ahora se hace un cambio de variable, 
definiendo una nueva función y por 


y(t) = P7!x(t) o, de manera equivalente, x(t) = Py(t) 


La ecuación x(t) = Py(t) indica que y(t) es el vector de coordenadas de x(t) respecto a la 
base de vectores propios. La sustitución de Py para x en la ecuación x’ = Ax da 


d 
q PY) = ACP Y) =(PDP"')P y = PDy (5) 


Como P es una matriz constante, el lado izquierdo de (5) es Py”. Ambos lados de (5) se mul- 
tiplican por la izquierda por P7! y se obtiene y’ = Dy, o bien, 


yi) A 0O > 0 yı(t) 

OAJ |0 % i y2(t) 
i ; FO) : 

yy (t) 0 eS 0 An YnÍt) 


El cambio de variable de x a y desacopló el sistema de ecuaciones diferenciales, porque 
la derivada de cada función escalar y; tan solo depende de yz. (Revise el cambio de variables 
análogo de la sección 5.6). Como y; = My1, se tiene que y1 (1) = ciet, con fórmulas simi- 
lares para y2,..., Yn. ASÍ, 


cje’! 


yt) = |, donde | : | = y(0) = P™'x(0) = P™'xo 


Cne’! 


C1 


Cn 
Para obtener la solución general x del sistema original, calcule 


x(t) = Py()=[v1 :* vnly() 
Ant 


Civie?! +- H CnVne 


Este es el desarrollo de funciones propias construidas como en el ejemplo 1. 


Valores propios complejos 


En el siguiente ejemplo, una matriz real A tiene un par de valores propios complejos À y À, 
con vectores propios complejos asociados v y Y. (Recuerde de la sección 5.5 que para una 
matriz real, los valores propios complejos y sus vectores propios correspondientes se pre- 
sentan en pares conjugados). Entonces, dos soluciones de x’ = Ax son 


4 y x(t) = Fe” (6) 


xı (t) = ve 
Utilizando una representación en serie de potencias de la función exponencial compleja 
se demuestra que x2(t) = xı (t). No obstante que las funciones propias complejas xı y X2 
son convenientes para algunos cálculos (sobre todo en ingeniería eléctrica), las funciones 
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FIGURA 4 


reales son más adecuadas para diversos fines. Afortunadamente, las partes real e imaginaria 
de xı son soluciones (reales) de x’ = Ax, porque son combinaciones lineales de las solucio- 
nes de (6): 


1 == 1 Hax 
Re(ve*!) = zx) +xı(t)], Im(ve*) = zy xO — x1(t) ] 


Para entender la naturaleza de Re(ve””), recuerde que en cálculo para cualquier número x, 
la función exponencial e* se determina mediante la serie de potencias: 


x 1 2 1 n 
e= ltr alo a 
2! n! 


la cual se utiliza para definir e™ cuando À es complejo: 
1 1 
e =14 004 00 + + AO 
Escribiendo A = a + bi (con a y b reales), y utilizando series de potencias similares para las 


funciones coseno y seno, se obtiene que 


¿e Dt = e (cos bt + i sen bt) (7) 


=e".e 
Por lo tanto, 
ve?! = (Re v + ¡Im v) - e“ (cos bt + i senbt) 
= [ (Re v) cos b£ — (Im v) senbt Je” 
+ ¡[ (Re v) senbt + (Im v) cos bt Je” 


Entonces, dos soluciones reales de x’ = Ax son 


yı(t) = Re x(t) = [(Re v) cos bt — (Im v) sen bt]e” 
y(t) = Im x(t) = [(Re v) sen bt + (Im v) cos bt]e” 


Se puede demostrar que yı y y2 son funciones linealmente independientes (cuando b + 0).! 


EJEMPLO 3 El circuito de la figura 4 se describe con la ecuación 


ip |  |-Ry/L  -—1/L ie 
vh | | 1yce -—1/(R1C) || ve 


donde iz es la corriente que pasa en el inductor L y vç es la caída de voltaje en el capacitor 
C. Suponga que R; = 5 ohms, R3 = .8 ohms, C = .1 farad y L = .4 henry. Encuentre las 
fórmulas para i, y uc, si la corriente inicial en el inductor es 3 amperes y el voltaje inicial 
en el capacitor es 3 volts. 


41 2,3) 
10 -—2 


en la sección 5.5 produce el valor propio A = —2 + 51 y el vector propio correspondiente 


SOLUCIÓN Para los datos dados, A = | | Yy Xo = [a El método analizado 


v = | a Las soluciones complejas de x’ = Ax son combinaciones lineales complejas de 
i | (—2+5i —i | (—2—5i 
x= [50 2+5i)t y we) =| e 2—5i)t 


1 Puesto que x2(f) es el complejo conjugado de x(t), las partes real e imaginaria de xa(1) son y1(1) y —ya(1), respec- 
tivamente. Entonces, se utiliza ya sea xı(f) o X2(f), pero no ambas, para producir dos soluciones reales linealmente 
independientes de x’ = Ax. 


FIGURA 5 





El origen como un punto espiral. 


5.7 


1. Una partícula que se mueve bajo un campo de fuerza plano tiene 
un vector de posición x que satisface x’ = Ax. La matriz A de 
2 x 2 tiene valores propios 4 y 2, con sus vectores propios aso- 


EJERCICIOS 
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Ahora, utilice la ecuación (7) para escribir 
x1 (1) = |; ecos 5t + i sen 5f) 


Las partes real e imaginaria de xı dan soluciones reales: 


nas e A y(t) = | cos 5t z 


2 cos 5t 2 sen 5t 


Como y; y y2 son funciones linealmente independientes, forman una base para el espacio 
vectorial bidimensional real de soluciones de x’ = Ax. Así, la solución general es 


_ —sen 5t | z; cos St | z 
x= a ll tel, sen 5,0 
: 3 : 0 1 3 
Para satisfacer x(0) = 3 | se necesita c1 2 +c ol=1|3| lo que conduce a cı = 1.5 


y c = 3. Por lo tanto, 


W= des s e+ a| e 


2 cos 5t 2 sen 5t 


o bien, 
iL(t) | _ | —1.5sen5t + 3cos5t | _>, 
velt) | | 3cos5t+6sen5t |f 
Véase la figura 5. E 


En la figura 5, el origen es un punto espiral del sistema dinámico. La rotación es causada 
por las funciones seno y coseno provenientes de un valor propio complejo. Las trayectorias 
en espiral entran, ya que el factor e7” tiende a cero. Recuerde que —2 es la parte real del 
valor propio del ejemplo 3. Cuando A tiene un valor propio complejo con parte real positiva, 
entonces las trayectorias en espiral son hacia fuera. Si la parte real del valor propio es cero, 
las trayectorias forman elipses alrededor del origen. 


PROBLEMAS DE PRÁCTICA 


A es una matriz real de 3 x 3 con valores propios —.5, .2 + .3i, y .2 — .3i, y vectores pro- 
pios correspondientes 


1 1+2i 1-21 
v = —2 3 V = 4i y v3= —4i 
1 2 2 


1. ¿Aes diagonalizable como A = PDP”?, utilizando matrices complejas? 


2. Escriba la solución general de x” = Ax utilizando funciones propias complejas y, después, 
encuentre la solución general real. 


3. Describa las formas de las trayectorias típicas. 


ciados v; = E] yvn= lE | Encuentre la posición de 


la partícula al tiempo £, suponiendo que x(0) = | p | 
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2. Sea A una matriz de 2 x 2 con valores propios —3 y —1 con 


: . = 1 
vectores propios asociados v, = | 1 | y Ya = | 1 | Sea x(t) 


la posición de una partícula al tiempo t. Resuelva el problema 


de valor inicial x” = Ax, x(0) = p 


En los ejercicios 3 a 6, resuelva el problema de valor inicial 
x'(t) = Ax(t) para t = 0, con x(0) = (3, 2). Clasifique la naturaleza 
del origen como un atractor, repulsor o punto silla del sistema di- 
námico descrito por x” = Ax. Encuentre las direcciones de mayor 
atracción y/o repulsión. Cuando el origen sea un punto silla, dibuje 


trayectorias típicas. 

2: 3 2 5 

ao] aa 
7 —1 l -2 

5. 4=|] a e a=; z] 

En los ejercicios 7 y 8, haga un cambio de variable que desaco- 

ple la ecuación x’ = Ax. Escriba la ecuación x(£) = Py(t) y muestre 


el cálculo que conduce al sistema desacoplado y' = Dy, especifi- 


cando P y D. 
7. A como en el ejercicio 5. $. A como en el ejercicio 6. 


En los ejercicios 9 a 18, construya la solución general de x' = Ax que 
implique funciones propias complejas y, después, determine la solu- 
ción general real. Describa las formas de trayectorias típicas. 


-3 2 3 1 
9. a= [7 aa] 10. isl J 


-3 -9 —7 10 
u. a=] 2 4 12. A=| | 


a 5 
43 = j 
ako aar 
-8 -12 —6 
15. [M4=| 2 1 2 
7 2 5 


16. 


17. 


18. 


20. 


21. 


22. 


cello 16 
M]4=| 2 5 4 
—4 -5 10 
30 64 23 
[M]4=|-11 -23 -9 
6 15 4 

30 -2 

[M] A= | 90 -52 -3 

20 -10 2 


[M] Encuentre fórmulas para los voltajes vı y v2 (como funcio- 
nes del tiempo 1) en el circuito del ejemplo 1, suponiendo que 
R¡ = 1/5 ohm, R, = 1/3 ohm, C; = 4 farads, Cz = 3 farads, y 
el voltaje inicial en cada capacitor es 4 volts. 


[M] Obtenga fórmulas para los voltajes v; y uv, en el circuito 
del ejemplo 1, suponiendo que R; = 1/15 ohm, R2 = 1/3 ohm, 
Cı = 9 farads, C2 = 2 farads y el voltaje inicial sobre cada ca- 
pacitor es 3 volts. 


[M] Encuentre fórmulas para la corriente i, y el voltaje vc 
para el circuito del ejemplo 3, suponiendo que R¡ = 1 ohm, 
R = .125 ohm, C = .2 farad, L = .125 henry, la corriente ini- 
cial es 0 amp y el voltaje inicial es 15 volts. 


[M] El circuito en la figura se describe por la ecuación 


i] f o 1/L i; 
vh | |-1y€  -1/(RC) || ve 


donde ir es la corriente en el inductor L y vc es la caída de 
voltaje en el capacitor C. Obtenga fórmulas para iz y vc cuan- 
do R = .5 ohm, C = 2.5 farads, L = .5 henry, la corriente inicial 
es 0 amp y el voltaje inicial de 12 volts. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Sí, la matriz de 3 x 3 es diagonalizable ya que tiene tres valores propios distintos. El teo- 
rema 2 de la sección 5.1 y el teorema 5 de la sección 5.3 son válidos cuando se utilizan 
escalares complejos. (Las pruebas son esencialmente las mismas que para los escalares 


reales). 


2. La solución general tiene la forma 


1 
x(1) =C1 
1 


2 (e +c) 4i 


1+2i 1-21 
¿(24301 + c3 —4i 


2 2 


¿(2301 


Aquí los escalares c1, C2, c3 pueden ser números complejos cualesquiera. El primer 
término en x(t) es real. Es posible obtener dos soluciones reales adicionales utilizando 
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las partes real e imaginaria del segundo término en x(t): 


1+21 
4i e” (cos .3t + i sen .3t) 
2 


La solución general real tiene la siguiente forma, con escalares reales c1, C2, C3: 


1 cos .3£ —2 sen .31 sen.31 + 2cos .31 
al -—2 e +c —4 sen .31 e” +e 4cos .31 e” 
1 2 cos .3t 2 sen .3t 


3. Cualquier solución con c2 = c3 = 0 es atraída hacia el origen debido al factor exponen- 
cial negativo. Otras soluciones tienen componentes que crecen sin cota, en tanto que las 
trayectorias son espirales hacia afuera. 

Sea cuidadoso para no confundir este problema con el de la sección 5.6. Ahí la con- 
dición para atracción hacia 0 fue que un valor propio era menor que 1 en magnitud, para 
que [A]* — 0. Aquí la parte real del valor propio debe ser negativa, para que e¥ — 0. 
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En las aplicaciones científicas del álgebra lineal, los valores propios rara vez se conocen 
con precisión. Por fortuna, una aproximación numérica cercana es bastante satisfactoria. 
En efecto, algunas aplicaciones tan solo requieren una aproximación burda al valor propio 
más grande. El primer algoritmo que se describe abajo sirve muy bien para este caso. Además, 
proporciona un fundamento para un método más poderoso que también aportaría estima- 
ciones rápidas para los valores propios restantes. 


El método de potencias 


El método de potencias se aplica a una matriz A de n x n, con un valor propio estrictamente 
dominante A, lo cual significa que A; debe ser, en valor absoluto, mucho más grande que 
todos los demás valores propios. En tal caso, el método de potencias produce una secuen- 
cia escalar que se aproxima a A; y una secuencia vectorial que se aproxima al vector propio 
correspondiente. El antecedente para el método es la descomposición de vectores propios que 
se utilizó al inicio de la sección 5.6. 

Por sencillez, suponga que A es diagonalizable y que R” tiene una base de vectores 
propios V1,..., Vn, colocados de manera que los valores propios correspondientes Aj,..., An 
disminuyan de tamaño, con el primer valor propio estrictamente dominante. Es decir, 


Aal > Ral > [43] > +-+ > lAn] 0) 
t esiticiarientè mayor 


Como se vio en la ecuación (2) de la sección 5.6, si x en R” se escribe en la forma 
X = CiV¡ + *** + CpV,, entonces, 


AFX = ci (A1) vi + ca(A2) v2 + + enn, (k=1,2,...) 
Suponga que cı + 0. Por lo tanto, dividiendo entre (AY, 


1 
(Ay 


De la desigualdad (1), las fracciones A2/Aj,..., Ay/A1 son menores que 1 en magnitud y por 
ende sus potencias tienden a cero. Así, 





z AN Aye 
X=C¡V¡ +C) 2 Va ++ Chn A Y” (k=1,2,...) (2) 


Ay rAx > CV como k —> 00 (3) 
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De manera que para k grande, un escalar múltiplo de A*x casi determina la misma dirección 
como el vector propio c¡,v¡. Puesto que un múltiplo escalar positivo no cambia la dirección de 
un vector, entonces A*x casi apunta en la misma dirección que v¡ o —v1, sic¡ 4 0. 


EJEMPLO 1 Sean A= le val v = H y X= ¡Fl Entonces, A tiene 
los valores propios 2 y 1, y el espacio propio para A; = 2 es la línea que pasa por 0 y v;. 
Para k = 0,..., 8, calcule A*x y construya la línea por 0 y A*x. ¿Qué sucede conforme k se 
incrementa? 


SOLUCIÓN Los primeros tres cálculos son 
1.8 8 || —.5 —.1 
ax=| 2 ea | 1 =[ 71] 
2 _|18 S|=1|_| 7 
CASE | 2 12j|11]7 [13 


Re DUNA 1.8 .8 
Ax = A(A | > al 


Cálculos semejantes permiten elaborar la tabla 1. 


TABLA 1 Iteración de un vector 
1 2 3 4 5 6 7 8 


a eel 


En la figura 1 se ilustran los vectores x, AX,..., A*x. Los otros crecen demasiado y se 
dificulta dibujarlos. Sin embargo, se han trazado segmentos de recta para mostrar las di- 
recciones de esos vectores. En efecto, las direcciones de los vectores es lo que realmente 
se desea observar, no los vectores mismos. Las rectas parecen aproximarse a la recta que 
representa el espacio propio generado por vı. Más precisamente, el ángulo entre la recta (sub- 
espacio) determinada por A*x y la recta (espacio propio) definida por v; tiende a cero cuan- 
do k—> %. al 





Xx 


Espacio propio 





Ex, 


1 + 10 





FIGURA 1 Direcciones determinadas por x, AX, AX... AX. 


Se escalan los vectores (A1)XA*x en la ecuación (3) para hacerlos converger a c¡v;, si 
cı + 0. No se puede escalar A'x en esta forma porque se desconoce A. Sin embargo, sí es 
posible escalar cada A*x para hacer que su entrada sea 1. Entonces, resulta que la secuencia 
{xx} convergerá a un múltiplo de vı cuya mayor entrada es 1. La figura 2 muestra la secuen- 
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cia escalada para el ejemplo 1. El valor propio A; también se estima a partir de la secuencia 
{x}. Cuando x se acerca a un vector propio para Ay, el vector Axx está cerca de A¡Xz, con 
cada entrada en AX, aproximadamente igual a À; veces la entrada correspondiente en xz. 
Como la entrada más grande en xz es 1, por lo tanto, la mayor entrada en Axz es casi Aj. 
(Se omiten pruebas cuidadosas de estos enunciados). 





1 
2 
Ax 
Ax 
ados 
X=X\ X1 X, X31 
X, i Espacio propio 
1 
¡—Múltiplo de v, 
Ex; 
1 4 


FIGURA 2 Múltiplos escalados de x, Ax, A?X,..., ATX. 


MÉTODO DE POTENCIAS PARA ESTIMAR UN VALOR PROPIO ESTRICTAMENTE 
DOMINANTE 


1. Seleccione un vector inicial xy cuya entrada más grande sea 1. 

2. Parak = 0, 1,..., 
a) Calcule Axz. 
b) Sea uk una entrada en Ax; cuyo valor absoluto es tan grande como sea posible. 
c) Determine X+1 = (1/pJAXx:. 


3. Para casi todas las elecciones de xo, la secuencia (uz) se aproxima al valor propio 
dominante, y la secuencia {x} tiende a un vector propio correspondiente. 


EJEMPLO 2 Aplique el método de potencias a A = E ] con Xo = al Pare 


cuando k = 5, y estime el valor propio dominante y un vector propio correspondiente 
de A. 


SOLUCIÓN Los cálculos en este ejemplo y en el siguiente fueron realizados con MATLAB, 
que calcula con 16 dígitos de exactitud, no obstante que aquí tan solo se muestran pocos deci- 
males. Para comenzar, calcule Axo e identifique la entrada más grande mo en Axo: 


molt JEE e= 


Escale Axo por 1/uoọ para obtener x,, calcule Ax, e identifique la mayor entrada en Axı: 


1 iFs 1 
= —A = — = 
n=l] 
6 311 8 
Ax =| | leal pS 


Escale Ax, por 1/1, para obtener x>, determine Ax) e identifique la mayor entrada en Axo: 


S E 
LL] 1208 


6 5]f 1 7.125 
Ae : A Es z ol PaSA 
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Escale Ax» por 1/12 para obtener x3, y así sucesivamente. Los resultados de los cálculos 
con MATLAB para las primeras cinco iteraciones se dan en la tabla 2. 


TABLA 2 Método de potencias para el ejemplo 2 
k 0 1 2 3 4 5 





0 1 1 1 1 1 
mE 1 4 .225 .2035 .2005 .20007 
Ax 5 8 7.125 7.0175 7.0025 7.00036 
a 2 1.8 1.450 1.4070 1.4010 1.40014 


Hk 5 8 7.125 7.0175 7.0025 7.00036 





La evidencia de la tabla 2 sugiere significativamente que [x,) se aproxima a (1, .2) y 
que (pu) se aproxima a 7. Si es así, entonces (1, .2) es un vector propio y 7 es el valor propio 
dominante. Esto se comprueba fácilmente calculando 


RE a slo i 


La secuencia {ug} del ejemplo 2 tuvo convergencia rápida a A; = 7 porque el segun- 
do valor propio de A fue mucho más pequeño. (En efecto, A, = 1). En general, la rapidez de 
convergencia depende de la razón |A2/ àil, porque en la ecuación (2) el vector ca(à2/À1)fv2 
es la principal fuente de error, cuando se utiliza una versión escalada de A*x como un es- 
timador de c¡v¡. (Las otras fracciones A/A, son mucho más pequeñas). Si |A2/ AM] es cercana 
a 1, entonces {ug} y {X} pueden converger muy lentamente y se preferirían otros métodos 
de aproximación. 

Con el método de potencias, hay una leve posibilidad de que el vector inicial elegido x 
no tenga componente en la dirección vı (cuando cı = 0). Pero el error de redondeo compu- 
tacional durante los cálculos de x podría crear un vector con al menos una pequeña com- 
ponente en la dirección de vı. Si eso ocurre, entonces Xx; empezará a converger a un múltiplo 
de vı. 


Método de potencias inverso 


Este método brinda una aproximación para cualquier valor propio, si se tiene una buena 
estimación inicial a: del valor propio A. En tal caso, sea B = (A — al) | y se le aplica el 
método de potencias a B. Se puede demostrar que si los valores propios de A son Aj,..., An, 
entonces los valores propios de B son 











1 1 1 
A=0" da? * Ay —Q 
y los vectores propios correspondientes coinciden con los de A. (Véase los ejercicios 
15 y 16). 

Suponga, por ejemplo, que a está más cerca de A que de los otros valores propios de A. 
Entonces, 1/(42 — a) será un valor propio estrictamente dominante de B. Si q está realmen- 
te cerca de Az, entonces 1/(A2 — œ) será mucho mayor que los demás valores propios de B, 
y el método de potencias inverso produce una aproximación rápida a À para casi todas las 
elecciones de xq. El siguiente algoritmo presenta los detalles. 
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MÉTODO DE POTENCIAS INVERSO PARA ESTIMAR UN VALOR PROPIO A DE A 
1. Seleccione una estimación inicial A lo suficientemente cerca a A. 
2. Elija un vector inicial Xy cuya entrada más grande sea 1. 
3. Parak=0, l,..., 
a) Resuelva (A — 41 )y, = Xx para yz. 
b) Sea ug una entrada en yz cuyo valor absoluto es tan grande como sea posible. 
c) Calcule vk = œ + (1/Ux). 
d) Determine Xk+1 = (1/Uk)Yyk. 


4. Para casi todas las elecciones de xp, la secuencia [v,) se aproxima al valor propio 
A de A, y la secuencia {x} tiende a un vector propio correspondiente. 


Observe que B, o bien (A — al)”!, no se encuentra en el algoritmo. En vez de calcular 
(A — al) lx; para obtener el siguiente vector en la secuencia, es mucho mejor resolver 
la ecuación (A — a)y; = Xx para yz (y después escalar yy para producir X¿+1). Como esta 
ecuación para y, se debe resolver para cada k, entonces una factorización LU de A — al 
acelerará el proceso. 


EJEMPLO 3 En algunas aplicaciones no es poco común necesitar conocer el valor pro- 
pio más pequeño de una matriz A y tener a mano estimaciones burdas de los valores propios. 
Suponga que 21, 3.3 y 1.9 son estimaciones para los valores propios de la matriz A que se 
muestra a continuación. Encuentre el valor propio más pequeño, exacto a seis decimales. 


10 =$ —4 
A=|-8 13 4 
-4 5 4 


SOLUCIÓN Los dos valores propios menores parecen estar cercanos entre sí, de modo que 
se emplea el método de potencias inverso para A — 1.97. La tabla 3 muestra los resultados de 
los cálculos obtenidos con MATLAB. Aquí xy se eligió arbitrariamente, y, = (A — 1.91) 1Xz, 
u es la entrada más grande en yz, V = 1.9 + 1/p y Xx+1 = (1/u0yr Resulta que la esti- 
mación inicial del valor propio fue muy buena y la secuencia de potencias inversa convergió 
de manera rápida. El valor propio más pequeño es exactamente 2. E 


TABLA 3 Método de potencias inverso 








k 0 1 2 3 4 
1 .5736 .5054 .5004 .50003 
Xk 1 .0646 .0045 .0003 .00002 
1 1 1 1 1 
4.45 5.0131 5.0012 5.0001 5.000006 
Ye .50 .0442 .0031 .0002 .000015 
7.76 9.9197 9.9949 9.9996 9.999975 
Hk 7.76 9.9197 9.9949 9.9996 9.999975 
Vk 2.03 2.0008 2.00005 2.000004 2.0000002 


Si no se dispone de una estimación para el valor propio más pequeño de una matriz, 
se puede simplemente tomar œ = 0 en el método de potencias inverso. Esta elección de a 
funciona razonablemente bien, cuando el valor propio más pequeño está mucho más cerca 
de cero que los demás valores propios. 
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Los dos algoritmos presentados en esta sección son herramientas prácticas para muchas 
situaciones simples, y brindan una introducción al problema de la estimación de valores pro- 
pios. Un método iterativo más robusto y ampliamente utilizado es el algoritmo QR. Por ejem- 
plo, este es el corazón del comando eig (A) de MATLAB, que rápidamente calcula valores 
propios y vectores propios de A. En los ejercicios de la sección 5.2 se presenta una breve 
descripción del algoritmo QR. En casi todos los libros modernos de análisis numérico se 
presentan más detalles. 


PROBLEMA DE PRÁCTICA 


¿Cómo se podría decidir si un vector x dado es una buena aproximación a un vector propio 
de una matriz A? Si lo es, ¿cómo se estimaría el valor propio correspondiente? Experimente 


con 
5 8 4 1.0 
A=|8 3 -l y x= | —4.3 
4 ==. 2 8.1 
En los ejercicios 1 a 4, la matriz A va seguida por una secuencia (x;) A —2 —3 ] l ejercici ilizand ; 
generada por el método de potencias. Utilice esos datos para estimar ERA 6 7| Repita rek ejeracio (S aunlizando: lasi 


el mayor valor propio de A, y dé un vector propio correspondiente. ; i 
y prop y prop p guiente secuencia X, AX,..., Ax. 


Ls 4 3| 1 5 29 125 509 2045 
AA AE 1pP[ 13] 61 || 253 || 1021 [| 4093 


| | | 1 | | 1 | | 1 | | 1 | [M] Los ejercicios 7 a 12 requieren MATLAB u otra herramienta 
0 25 -3158 -3298 -3326 computacional. En los ejercicios 7 y 8, utilice el método de potencias 
con Xy dado. Liste {xz} y {ux} para k = 1,..., 5. En los ejercicios 9 y 








18  —.8 10, indique us y u6. 
2. A= ; 
7. A= , Xo = 
[ol [e] (PEA [Pa] [+] E 4 de ll 
0 1 1 1 1 E 2 1 fi 
A EA 
In 2 
3. telg J 8&8 0 12 1 
9 A=|1 -2 llx=|0 
1 1 .6875 55717 .5188 0 3 0 0 
0] .8 1 á 1 i 1 
1 2 -2 1 
10. 4A=| 1 1 9|x=]|0 
4.1 —6 
.A=| ` ; 1 9 0 
4 | 3 —4.4 l 9 
1 1 1 1 1 Otra estimación se puede realizar para un valor propio cuando está 
| 1] 7 En í | H ? sal í | 0] disponible un vector propio aproximado. Observe que si Ax = Ax, 
entonces x"Ax = x"(Ax) = MA"x), y el cociente de Rayleigh 
15 16 5 1 T 
= A 
5. Sea A a 21 | Los vectores X,..., A”x son ll RG) = a X 
xx 
| 31 | | -191 | | 991 | | —4991 | | 24991 | es igual a À. Si x es cercano a un vector propio para À, entonces este co- 
—4l 241 -1241 6241 31241 ciente es cercano a A. Cuando A es una matriz simétrica (47 = A), el 
Encuentre un vector con un 1 en la segunda entrada que sea cociente de Rayleigh R(x) = (x7 Axų)/(X{ x) tendrá aproximada- 
cercano a un vector propio de A. Use cuatro lugares decimales. mente el doble de dígitos de exactitud que el factor de escalamiento 
Compruebe su respuesta y dé una estimación para el valor pro- yx en el método de potencias. En los ejercicios 11 y 12 compruebe el 


pio dominante de A. aumento de precisión mediante el cálculo de ¡uz y R(xy) parak = 1,..., 4. 


5 2 1 
tae e 

-3 2 1 
E A 


Los ejercicios 13 y 14 se aplican a una matriz A de 3 x 3 cuyos valo- 
res propios se estiman como 4, —4 y 3. 


13. Si se conoce que los valores propios cercanos a 4 y —4 tienen 
diferentes valores absolutos, ¿funcionará el método de poten- 
cias? ¿El método continúa siendo útil? 


14. Suponga que se conoce que los valores propios cercanos a 4 
y —4 tienen exactamente el mismo valor absoluto. Describa 
cómo se podría obtener una secuencia que estime el valor pro- 
pio cercano a 4. 


15. Suponga que Ax = Ax con x % 0). Sean a un escalar distinto 
de los valores propios de A, y B = (A — al)!. Reste ax en 
ambos miembros de la ecuación Ax = Ax, y utilice álgebra para 
demostrar que 1/(A — a) es un valor propio de B, con x como 
un vector propio correspondiente. 


16. Suponga que u es un valor propio de B en el ejercicio 15, 
y que x es un vector propio correspondiente, de manera que 
(A — aly lx = px. Utilice esta ecuación para encontrar un 
valor propio de A en términos de y y a. [Nota: u + 0 porque 
B es invertible]. 


17. [M] Utilice el método de potencias inverso para estimar el valor 
propio intermedio de la A del ejemplo 3, con una exactitud a 
cuatro lugares decimales. Haga Xy = (1, O, 0). 
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18. [M] Sea A como en el ejercicio 9. Aplique el método de poten- 
cias inverso con Xy = (1, 0, 0) para estimar el valor propio de A 
cercano a œ = —1.4, con una exactitud a cuatro decimales. 


[M] En los ejercicios 19 y 20, determine: a) el valor propio más 
grande y b) el valor propio más cercano a cero. En cada caso, Xo = 
(1, O, O, 0) y realice las aproximaciones hasta que la secuencia de 
acercamiento parezca exacta con cuatro decimales. Incluya el vector 
propio aproximado. 


ADAN 
— 
o 


— 
UUNN 
— 
Ww 
— 
— 


21. Un error común es que si A tiene un valor propio estrictamente 
dominante, entonces, para cualquier k suficientemente grande, 
el vector A*x es aproximadamente igual a un vector propio de 
A. Para las tres matrices que se muestran a continuación, estudie 
qué sucede a A*x cuando x = (.5, .5), e intente obtener conclu- 
siones generales (para una matriz de 2 x 2). 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Para A y x dados, 


5 
Ax=|8 3 -l 
4 


8 0 1 0 
aa=| s] » A=|, Al 
8 0 
ES E >] 
8 4 1.00 3.00 
—4.30 | = | —13.00 
=i a 8.10 24.50 


Si Ax es cercanamente un múltiplo de x, entonces las razones de las entradas correspondientes 
en los dos vectores deberían ser casi constantes. Entonces, calcule: 


{entrada en Ax} = {entradaenx} = {razón} 
3.00 1.00 3.000 
—13.00 —4.30 3.023 
24.50 8.10 3.025 


Cada entrada en Ax es alrededor de tres veces la entrada correspondiente en x, de manera que 


x es cercano a un vector propio de A. Cualesquiera de las razones anteriores es una estimación 
del valor propio. (Con cinco decimales, el valor propio es 3.02409). 
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CAPÍTULO 5 EJERCICIOS COMPLEMENTARIOS 


En estos ejercicios suplementarios, A y B representan matrices cua- 
dradas de tamaño adecuado. 


1. Marque cada enunciado como verdadero o falso. Justifique cada 
respuesta. 


a) SiA es invertible y 1 es uno de sus valores propios, entonces 
1 también es valor propio de A”!. 


b) Si A es equivalente por filas a la matriz identidad /, enton- 
ces A es diagonalizable. 


c) Si A contiene una fila o una columna de ceros, entonces O 
es un valor propio de A. 


d) Cada valor propio de A también lo es de A?. 
e) Cada vector propio de A también lo es de 4?. 


f) Cada vector propio de una matriz invertible A también lo 
es de A7!. 


g) Los valores propios deben ser escalares diferentes de cero. 
h) Los vectores propios deben ser vectores distintos de cero. 


i) Dos vectores propios correspondientes al mismo valor pro- 
pio siempre son linealmente dependientes. 


j) Las matrices similares siempre tienen exactamente los mis- 
mos valores propios. 


k) Las matrices similares siempre tienen exactamente los 
mismos vectores propios. 


1) La suma de dos vectores propios de una matriz A también 
es vector propio de esta. 


m) Los valores propios de una matriz triangular A superior son 
exactamente las entradas distintas de cero sobre la diagonal 
de A. 


n) Las matrices A y A” tienen los mismos valores propios, con- 
tando sus multiplicidades. 


o) Si una matriz A de 5 x 5 tiene menos de 5 valores pro- 
pios distintos, entonces A no es diagonalizable. 


p) Existe una matriz de 2 x 2 que no tiene vectores propios 
en R?. 


q) Si A es diagonalizable, entonces las columnas de A son li- 
nealmente independientes. 


r) Un vector distinto de cero no puede corresponder a dos va- 
lores propios diferentes de A. 


s) Una matriz (cuadrada) A es invertible si y solo si existe un 
sistema de coordenadas donde la transformación x —> AX 
esté representada por una matriz diagonal. 


t) Si cada vector ej en la base estándar para R” es un vector 
propio de A, entonces A es una matriz diagonal. 


u) Si A es similar a una matriz diagonalizable B, entonces A 
también es diagonalizable. 


v) Si A y B son matrices de n x n invertibles, entonces AB es 
similar a BA. 


w) Una matriz de n x n con n vectores propios linealmente in- 
dependientes es invertible. 


10. 


11. 


x) Si A es una matriz de n x n diagonalizable, entonces cada 
vector en R” se escribe como una combinación lineal de vec- 
tores propios de A. 


Demuestre que si x es un vector propio de la matriz producto AB 
y Bx + 0, entonces Bx es un vector propio de BA. 


Suponga que x es un vector propio de A correspondiente a 
un valor propio À. 


a) Pruebe que x es un vector propio de 5/ — A. ¿Cuál es el valor 
propio asociado? 


b) Demuestre que x es un vector propio de 51 — 3A + A?. ¿Cuál 
es el valor propio asociado? 


Utilice inducción matemática para demostrar que si A es un 
valor propio de una matriz A de n x n, con x como un vector 
propio correspondiente, entonces, para cada entero positivo m, 
A” es un valor propio de A” con x como un vector propio co- 
rrespondiente. 


Si p(t) = co + cıt + cat? +--+ + Cnt”, defina p(A) como la 
matriz formada al remplazar cada potencia de t en p(t) por 
la potencia correspondiente de A (con A% = J). Es decir, 


p(A) = col +c A + c,4? Hee H Cn A” 
Demuestre que si A es un valor propio de A, entonces un valor 


propio de p(A) es p(A). 


0 7 


a) Sea B = 5I — 3A + A?. Demuestre que B es diagonalizable 
encontrando una factorización conveniente de B. 


Suponga que A = PDP £, donde P es 2 x 2 y D = | EA | 


b) Dados p(t) y p(4) como en el ejercicio 5, demuestre que 
p(A) es diagonalizable. 


Suponga que A es diagonalizable y que p(t) es el polinomio 
característico de A. Defina p(A) como en el ejercicio 5, y prue- 
be que p(A) es la matriz cero. Este hecho, el cual es válido para 
cualquier matriz cuadrada, se conoce como teorema de Cayley- 
Hamilton. 


a) Sea A una matriz de n x n diagonalizable. Demuestre que si 
la multiplicidad de un valor propio A es n, entonces A = ÀJ. 


b) Utilice el inciso a) para demostrar que la matriz 


A= 3 ! no es diagonalizable. 
0 3 

Demuestre que 7 — A es invertible cuando todos los valores 

propios de A son menores que 1 en magnitud. [Sugerencia: 

¿Qué sería cierto si 7 — A no fuera invertible?] 


Demuestre que si A es diagonalizable, con todos los valores pro- 
pios menores que 1 en magnitud, entonces Af tiende a la matriz 
cero conforme k > %. [Sugerencia: Considere A*x donde x re- 
presenta cualquiera de las columnas de Z]. 


Sean u un vector propio de A correspondiente a un valor pro- 
pio A, y H la recta en R” que pasa por u y por el origen. 


a) Explique por qué H es invariante bajo A en el sentido de que 
Ax está en H siempre que x esté en H. 


12. 


b) Sea K el subespacio unidimensional de R” que es invariante 
bajo A. Explique por qué K contiene un vector propio de A. 


A 


sac=| o 


al Utilice la fórmula (1) para el determi- 


nante dado en la sección 5.2 para explicar por qué det G = 
(det A)(det B). De esto, deduzca que el polinomio característico 
de G es el producto de los polinomios característicos de A y B. 


Utilice el ejercicio 12 para encontrar los valores propios de las matri- 
ces en los ejercicios 13 y 14. 


13. 


14. 


15. 


16. 


17. 


18. 


32 8 
A=|0 5 -2 
0-4 3 
1 5 —6 -7 
|2 4 5 2 
“jlo o0 -7 4 
e 


Sea J la matriz de n x n con todas las entradas igual a 1, y con- 
sidere A = (a — b)I + bJ; es decir, 


a b b >. b 
b a b >. b 


Con los resultados del ejercicio 16 de los ejercicios comple- 
mentarios del capítulo 3 demuestre que los valores propios de 
A sona — b ya + (n — 1)b. ¿Cuáles son las multiplicidades 
de esos valores propios? 


Aplique el resultado del ejercicio 15 para obtener los valores 


lo 2 2 
propios de las matrices| 2 1 2 
2 2 1 
T 3- 3o33 
35 TA Ga Br Sa | 
yi3 3 7 3 31 
BAR 
Y Bl a A 
Sea A = p ce | Recuerde del ejercicio 25 de la sec- 
a21 422 


ción 5.4 que tr A (la traza de A) es la suma de las entradas diago- 
nales en A. Demuestre que el polinomio característico de A es 


22 — (tr AJA + det A 


Entonces, demuestre que los valores propios de una matriz A 


tray 
de 2 x 2 son reales si y solo si det A < (=) ; 


Sea A = e P | Explique por qué A%* se aproxima a 
=5 —.15 
| 10 Tag | cuando k=. 


Los ejercicios 19 a 23 conciernen al polinomio 


p(t) = ao + ait +++: + ant"! + t” 
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y a una matriz C, de n x n llamada matriz compañera de p: 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


0 1 0 ... 10) 

0 0 1 0 

0 0 0 1 
40 41 02 —An—1 


Escriba la matriz compañera C, para p(t) = 6 — 5t + f y, luego, 
determine el polinomio característico de Cp. 


Sea p(t) = (t — 2)(t — 3)(t — 4) = -24 + 261 — 91? + £?. 
Escriba la matriz compañera para p(t), y utilice las técnicas del 
capítulo 3 para obtener su polinomio característico. 


Utilice inducción matemática y pruebe que para n = 2, 


det(C, — ÀI) = (—1)" (ao + a1 + ++- + an1"! + A”) 
=(-1)" pà) 

[Sugerencia: Desarrolle por cofactores sobre la primera colum- 

na, para demostrar que det (C, — ÀJ) tiene la forma (—A)B + 

(- 1)"4o, donde B es cierto polinomio (por la suposición de in- 

ducción)]. 

Sean p(t) = aọ + aıt + azt? + t’, y A un cero de p. 

a) Escriba la matriz compañera para p. 

b) Explique por qué 1? = —ay — a,4 — a24?, y demuestre que 
(1, A, A?) es un vector propio de la matriz compañera de p. 

Sea p el polinomio del ejercicio 22, y suponga que la ecuación 


p(t) = 0 tiene las raíces distintas A1, A2, Az. Sea V la matriz de 
Vandermonde 


DE y 
V=l4 a 4d 
A 4 


(La transpuesta de V se consideró en el ejercicio comple- 
mentario 11 del capítulo 2). Utilice el ejercicio 22 y un teo- 
rema de este capítulo para deducir que V es invertible (pero 
no calcule V”7!). Después, explique por qué VIC, V es una 
matriz diagonal. 


[M] El comando roots (p) de MATLAB calcula las raíces de 
la ecuación polinomial p(t) = 0. Lea un manual de MATLAB y, 
luego, describa la idea básica que sustenta el algoritmo para el 
comando roots. 


[M] Aplique un programa matricial para diagonalizar 


32 0 
A=| 14 7 -l 
—6 -—3 1 


si es posible. Utilice el comando de valores propios para cons- 
truir la matriz diagonal D. Si el programa tiene un comando 
que genere vectores propios, úselo para crear una matriz inverti- 
ble P. Después, determine AP — PD y PDP”!. Analice sus 
resultados. 


—8 5 -2 j 


y La =5 2 1 -2 
[M] Repita el ejercicio 25 para A = 10 -8 6 3l 
3-2 1 0 


cuadrados 


EJEMPLO INTRODUCTORIO 


Base de datos geográficos de 
Norteamérica y sistema 
de navegación GPS 


Imagine que inicia un enorme proyecto que, según las esti- 
maciones, durará 10 años y requiere los esfuerzos de muchas 
personas para construir y resolver un sistema de 1,800,000 por 
900,000 ecuaciones lineales. Esto es exactamente lo que se 
hizo en 1974 con la encuesta geodésica nacional de Estados 
Unidos, cuando se actualizó el North American Datum (NAD), 
una red de 268,000 puntos de referencia localizados de manera 
precisa que generan el territorio completo de América del 
Norte, junto con Groenlandia, Hawai, las Islas Vírgenes, 
Puerto Rico y otras islas del Caribe. 


Las latitudes y longitudes registradas en el NAD se 
deben determinar con una precisión dentro del rango de unos 
cuantos centímetros, ya que constituyen la base de encuestas, 
mapas, límites legales de propiedad y planos de proyectos 
de ingeniería civil, como los de carreteras e instalaciones de 
servicios públicos. Sin embargo, se tuvieron que agregar más 
de 200,000 nuevos puntos a los ya existentes desde la última 
actualización en 1927, y se acumularon errores con el 
paso de los años debido a mediciones imprecisas y a 
corrimientos de la corteza terrestre. En 1983 concluyó 
la recolección de datos para el reajuste del NAD. 


El sistema de ecuaciones del NAD no tenía solución de la 
manera habitual, pero sí una solución de mínimos cuadrados, 
que asignó latitudes y longitudes a los puntos de referencia 
en la forma que mejor correspondía a las 1.8 millones de 
observaciones. En 1986 se encontró la solución de mínimos 
cuadrados al resolver un sistema relacionado de las llamadas 


Ortogonalidad y mínimos + 





ecuaciones normales, lo que implicó 928,735 ecuaciones con 
928,735 variables.! 


Más recientemente, el conocimiento de puntos de referen- 
cia en el suelo se ha vuelto crucial para determinar la ubica- 
ción exacta de satélites con el Sistema de posicionamiento glo- 
bal (Global Positioning System, GPS). Un satélite GPS calcula 
su posición en relación con la Tierra midiendo el tiempo que 
tardan las señales en llegar desde tres transmisores terrestres. 
Para hacer esto, los satélites utilizan relojes atómicos precisos 
que se han sincronizado con estaciones terrestres (cuyas ubi- 
caciones se conocen con exactitud gracias al NAD). 


El Sistema de posicionamiento global se utiliza para 
determinar las ubicaciones de los nuevos puntos de referencia 
terrestres y también para encontrar la ubicación del usuario 
sobre el suelo tomando como base los mapas ya existentes. 
Cuando el conductor de un automóvil (o un alpinista) 
enciende un receptor GPS, este último mide los tiempos de 
llegada de señales provenientes de al menos tres satélites. 
Esta información, junto con los datos transmitidos sobre 
las ubicaciones de los satélites y los tiempos del mensaje, 
se utiliza para ajustar el tiempo del receptor GPS y así 
determinar su ubicación aproximada sobre la Tierra. Con la 
información proveniente de un cuarto satélite, el receptor 
GPS puede incluso establecer su altura aproximada. 


1 Se presenta un análisis matemático de la estrategia de solución (junto 
con detalles de todo el proyecto NAD) en North American Datum of 1983, 
Charles R. Schwarz (ed.), National Geodetic Survey, National Oceanic and 
Atmospheric Administration (NOAA) Professional Paper NOS 2, 1989. 
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Los problemas del NAD y el GPS se resuelven explicación de esta aparente contradicción requerirá de 


»” 


encontrando un vector que “satisface aproximadamente las ideas desarrolladas en las primeras cinco secciones 


un sistema de ecuaciones inconsistente. Una cuidadosa de este capítulo. 





Para obtener una solución aproximada de un sistema de ecuaciones inconsistente que carece 
de solución, se necesita una idea bien definida de cercanía. La sección 6.1 introduce los con- 
ceptos de distancia y ortogonalidad en un espacio vectorial. Las secciones 6.2 y 6.3 muestran 
cómo se puede emplear la ortogonalidad para identificar aquel punto dentro de un subespacio 
W que es el más cercano al punto y externo a W. Considerando a W como el espacio colum- 
na de una matriz, la sección 6.5 desarrolla un método para obtener soluciones aproximadas 
(“mínimos cuadrados”) de sistemas lineales inconsistentes, tal como el sistema resuelto para 
el informe NAD. 

La sección 6.4 brinda otra oportunidad para ver proyecciones ortogonales en acción, 
creando una factorización matricial ampliamente utilizada en álgebra lineal numérica. Las sec- 
ciones restantes examinan algunos de los muchos problemas de mínimos cuadrados que sur- 
gen en las aplicaciones, incluyendo aquellas en espacios más generales que R”. 


6.1 | PRODUCTO INTERIOR, LONGITUD Y ORTOGONALIDAD 


Aquí se definen para R” los conceptos geométricos de longitud, distancia y perpendiculari- 
dad, que son bien conocidos para R? y R?. Esos conceptos ofrecen poderosas herramientas 
geométricas para resolver muchos problemas aplicados, incluyendo los problemas ya men- 
cionados de mínimos cuadrados. Los tres conceptos se definen en términos del producto 
interior de dos vectores. 


Producto interior 


Si u y v son vectores en R”, entonces u y v se consideran matrices de n x 1. La transpuesta u” 


es una matriz de 1 x n, y el producto matricial u”y es una matriz de 1 x 1, que se representa 
como un solo número real (un escalar) sin corchetes. El número u”v se llama el producto 
interior de u y v, y con frecuencia se representa como u - v. Este producto interior, que se 
mencionó en los ejercicios de la sección 2.1, también se llama producto punto. Si 


ui vı 

YU Va 
u= y v= 

Un Un 


entonces, el producto interior de u y v es 


vı 


v2 
[uy 4 ce. E EE OVa D 


Un 


TEOREMA 1 


DEFINICIÓN 


%2 
(a, b) 
Va? + b? 
1b] 
lal [0 
FIGURA 1 


Interpretación de [|v|| como 
longitud. 


6.1 Producto interior, longitud y ortogonalidad 331 


2 3 
EJEMPLO 1 Calcule u-v y vu parau= | —5 |yv= 2 
1 -3 


SOLUCIÓN 


3 
uv=uv=[2 -5 -1]| 2| =@6) + 090) + (13) = -1 


2 
vu=vu=[3 2 -3]| -5 | =90 + O65 +C3C)=-1 m 
—1 


A partir de los cálculos en el ejemplo 1 resulta claro por qué u:v = v:u. La conmuta- 
tividad del producto interior es válida en general. Las siguientes propiedades del producto 
interior se deducen fácilmente de las características de la operación de transponer estudiada 
en la sección 2.1. (Véase los ejercicios 21 y 22 al final de esta sección). 


Sean u, v y w vectores en R”, y c un escalar. Entonces, 
a) wuv= vu 

b) (U + v):w = Uu:-w + v:w 

c) (cu) v = c(u:v) = u-(cv) 


d) uu=0, yuu=0siysolosiu =0 


Las propiedades b) y c) se pueden combinar varias veces para obtener la siguiente regla 
útil: 


C NN C E C N) 


Longitud de un vector 


Si v está en R”, con entradas v1,..., Vn, entonces la raíz cuadrada de v-v está definida, ya que 
v-v es no negativo. 


La longitud (o norma) de v es el escalar no negativo l|v|| definido por 


v| = Vvv = v? tou +e to? y Iv? = v-v 


; y a E: Ta 
Suponga que v está en R?, es decir, v = | b | Como es usual, si se identifica a v con un 


punto geométrico en el plano, entonces ||v|| coincide con el concepto estándar de la longitud 
del segmento de recta que va del origen a v. Esto se deduce a partir del teorema de Pitágoras 
aplicado a un triángulo como el de la figura 1. 

Un cálculo similar con la diagonal de una caja rectangular demuestra que la definición de 
longitud de un vector v en R? coincide con el concepto habitual de longitud. 

Para cualquier escalar c, la longitud de cv es lcl veces la longitud de v. Es decir, 


levl| = [clllvi 


(Para ver esto, calcule ||ev||? = (cv). (ev) = c?v-v = c?||v]|? y obtenga raíces cuadradas). 
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b) 


FIGURA 2 
Normalización de un vector para 
obtener un vector unitario. 


Un vector unitario es un vector cuya longitud es 1. Si un vector v distinto de cero se 
divide entre su longitud —es decir, se multiplica por 1/llvl|—, se obtiene un vector unitario u 
ya que la longitud de u es (1/l|v|)llvl|. El proceso de crear u a partir de v en ocasiones se 
llama normalización de v, y se dice que u está en la misma dirección que v. 

Los ejemplos que se presentan a continuación emplean notación de vectores (columnas), 
para ahorrar espacio. 


EJEMPLO 2 Sea v = (1, —2, 2, 0). Encuentre un vector unitario u en la misma direc- 
ción que vV. 
SOLUCIÓN Primero, calcule la longitud de v: 
Ivl? = v-v = (1? + 2? + (2? + (0 = 9 
Iv] = v9 =3 


Después, multiplique v por 1/||v|| para obtener 


1 1/3 
oli 3. 3| 2|. | 2/3 
0 0 


Para comprobar que ul] = 1 es suficiente probar que [Jul]? = 1. 


2 2 2 
OS 
+4+%+0=1 


2 
ful? = u- 
1 
9 


EJEMPLO 3 Sea W el subespacio de [R? generado por x = G, 1). Obtenga un vector 
unitario z que sea una base para W. 


SOLUCIÓN W consiste en todos los múltiplos de x, como el de la figura 2a). Cualquier vec- 
tor distinto de cero en W es una base para W. Para simplificar los cálculos, “escale” x para 
eliminar fracciones. Es decir, multiplique x por 3 para obtener 


-E 


Ahora calcule || y |? = 2? + 3? = 13, ly]| = v13, y normalice y para obtener 


das 1 kA 
J33 3/413 
Véase la figura 2b). Otro vector unitario es (—2/4~ 13, —3/4 13). E 


Distancia en R” 


Ahora ya estamos listos para describir qué tan cerca está un vector de otro. Recuerde que si a 
y b son números reales, la distancia sobre la recta numérica entre a y b es el número la — bl. 
En la figura 3 se ilustran dos ejemplos. Esta definición de distancia en R tiene una analogía 
directa en R”. 








a b a b 
q —257-%++ AAA HAHAHA 
1 2 3 4 5 6 7 8 9 -3 -2 -1 0 1 2 3 4 5 
| 6 unidades de separación | 7 unidades de separación | 
[AAA 
12-8l=|-61=6 o 18-2l=16l=6 (3) -4l=1-71=7 o 14-(-3)1=171=7 


FIGURA 3 Distancias en R. 





FIGURA 5 


DEFINICIÓN 
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Para u y ven R”, la distancia entre u y v, que se escribe como dist(u, v), es la longitud 
del vector u — v. Es decir, 


dist(u, v) = [[u — vl| 


En R? y R3, esta definición de distancia coincide con las fórmulas usuales de la distancia 
euclidiana entre dos puntos, como muestran los siguientes dos ejemplos. 


EJEMPLO 4 Determine la distancia entre los vectores u = (7, 1) y v = (3, 2). 


EL 
lu -v| = V? + (20? = v17 


La figura 4 muestra los vectores u, v y u — v. Cuando el vector u — v se suma a v, el 
resultado es u. Observe que en la figura 4 el paralelogramo revela que la distancia de u a v 
es igual a la distancia de u — v a 0. E 


SOLUCIÓN Calcule 








FIGURA 4 La distancia entre u y v es la 
longitud de u — v. 


EJEMPLO 5 Siu = (u1, u, u3) y V = (vı, v2, v3), entonces 


dist (u, v) = ||u — v|| = y (u — v): (u — v) 


= y (u; — v1)? + (u2 — v2)? + (u3 — v3)? E 





Vectores ortogonales 


El resto de este capítulo depende del hecho de que el concepto de rectas perpendiculares de 
geometría euclidiana tiene un análogo en R”. 

Considere R? o R? y dos rectas que pasan por el origen determinado por los vectores 
u y v. Las dos rectas que se muestran en la figura 5 son geométricamente perpendiculares si 
y solo si la distancia de u a v es la misma que la distancia de u a —v. Esto es lo mismo que 
requerir que los cuadrados de las distancias sean iguales. Ahora 


[dist(u, =v) Î = [lu — (=v)|? = [lu + vi? 
= (u + v): (u +v) 
=u (u +v)+v:(u+v) Teorema 1(b) 
=u: u +u: v +v u+. Teorema 1(a), (b) 


= [jul]? + [v]? + 2u- v Teorema 1(a) (1) 
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DEFINICIÓN 


TEOREMA 2 


u+v 


Ibvil 


lla + vil u 


v 
AS llull 


0 
FIGURA 6 


w 


FIGURA 7 

Un plano y una recta que pasan 
por 0 como complementos 
ortogonales. 


Los mismos cálculos con v y —v intercambiados indican que 
[dist(u, v)]? = llull? + || — vil? + 2u- (~v) 
= Juli? + llv]? — 2u-v 


Las dos distancias al cuadrado son iguales si y solo si 2u:v = —2u-v, lo que ocurre si y 
solo si uv = 0. 

Este cálculo demuestra que cuando los vectores u y v se identifican con puntos geométri- 
cos, las rectas correspondientes que pasan por los puntos y por el origen son perpendiculares 
si y solo si u-v = 0. La siguiente definición generaliza a R” este concepto de perpendiculari- 
dad (u ortogonalidad, como se le llama con frecuencia en álgebra lineal). 


Dos vectores u y v en R” son ortogonales (entre sí) si u:v = 0. 


Observe que el vector cero es ortogonal a todo vector en R” porque 07v = 0 para 
toda v. 

El siguiente teorema expone un dato útil en relación con los vectores ortogonales. 
La demostración se deduce inmediatamente de los cálculos en la ecuación (1) y de la defi- 
nición de ortogonalidad. El triángulo rectángulo que se ilustra en la figura 6 permite visua- 
lizar las longitudes que aparecen en el teorema. 


Teorema de Pitágoras 


Dos vectores u y v son ortogonales si y solo si |u + v|? = |lual? + |Įvl?. 


Complementos ortogonales 


Para practicar el uso de productos interiores, aquí se introduce un concepto que será útil en 
la sección 6.3 y en todo el capítulo. Si un vector z es ortogonal a todo vector en un subes- 
pacio W de R”, entonces se dice que z es ortogonal a W. El conjunto de todos los vectores z 
que son ortogonales a W se llama complemento ortogonal de W y se denota con W+ (que 
se lee “perpendicular a W”). 


EJEMPLO 6 Sean W un plano a través del origen en [R3, y L la recta que pasa por el 
origen y es perpendicular a W. Si z y w son distintos de cero, z está sobre L y w está en W, 
entonces el segmento de recta de 0 a z es perpendicular al segmento de recta de 0 a w; es 
decir, z-w = 0. Véase la figura 7. De manera que todo vector sobre L es ortogonal a cada w en 
W. En efecto, L consiste en todos los vectores que son ortogonales a todos los vectores w 
en W, y W consiste en todos los vectores ortogonales a todos los vectores z en L. Es decir, 
L=W+ y W=L+ w 
Los siguientes dos hechos sobre W+, con W como un subespacio de R”, se necesi- 
tarán más adelante en este capítulo. Las demostraciones se sugieren en los ejercicios 29 y 30. 
Los ejercicios 27 a 31 ofrecen una excelente oportunidad de practicar con las propiedades del 
producto interior. 


1. Un vector x está en W+ si y solo si x es ortogonal a cada vector de cualquier con- 
junto que genera a W. 


2. W+ es un subespacio de R”. 


TEOREMA 3 
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El siguiente teorema y el ejercicio 31 comprueban las afirmaciones hechas en la sec- 
ción 4.6 en relación con los subespacios que se muestran en la figura 8. (Véase también el 
ejercicio 28 de la sección 4.6). 


A 
J , L 
Ny » 
Ya ye 
pl? So 


FIGURA 8 Los subespacios fundamentales 
determinados por una matriz A de m x n. 


Sea A una matriz de m x n. El complemento ortogonal del espacio fila de A es el espa- 


cio nulo de A, y el complemento ortogonal del espacio columna de A es el espacio nulo 
de AT: 


(FilA)+=NulA y (Col A)*= Nul A7 


DEMOSTRACIÓN La regla fila-columna para calcular Ax indica que si x está en Nul A, 
entonces x es ortogonal a cada fila de A (con las filas consideradas como vectores en R”). 
Como las filas de A generan el espacio fila, entonces x es ortogonal a Fil A. Y a la inversa, 
si x es ortogonal a Fil A, entonces x, evidentemente, es ortogonal a cada fila de A, y por lo 
tanto, Ax = 0. Esto demuestra el primer enunciado del teorema. Ya que este enunciado es 
verdadero para cualquier matriz, es válido para A”. Es decir, el complemento ortogonal del 
espacio fila de A es el espacio nulo de A”. Esto demuestra la segunda afirmación porque 
Fil 47 = Col A. E 


Ángulos en R? y R3 (opcional) 


Si u y v son vectores distintos de cero en R? o R3, entonces existe una agradable conexión 
entre su producto interior y el ángulo Y entre los dos segmentos de recta que van del origen 
a los puntos identificados con u y v. La fórmula es 


u-y = llul| [[v[| cos 9 (2) 


Si se desea comprobar esta fórmula para vectores en R?, considere el triángulo que se 
ilustra en la figura 9, con lados de longitudes |lul|, [|v|| y [lu — vl]. De acuerdo con la ley de 
los cosenos, 








2 2 2 
la = vlt = (Jul? + livit — 2lful] llv] cos 2 


(uj, u3) 


llu — vil 


llull y (Vi v) 


G llvII 


FIGURA 9 El ángulo entre dos vectores. 
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que se puede reordenar para obtener 


1 
lull ivl cos? = 5 [lal + Ivl? — lu — vi] 


1 
j [uz + uż + v? + v? — (ui — v)? — (u2 — v2)?] 
UU] + U2U) 


u.v 


La comprobación es similar para R%. Cuando n > 3, la fórmula (2) se puede utilizar para 
definir el ángulo entre dos vectores en [R”. En estadística, por ejemplo, el valor de cos Y 
definido por la ecuación (2) para vectores convenientes u y v es lo que los especialistas en 


estadística llaman coeficiente de correlación. 


PROBLEMAS DE PRÁCTICA 


Sean a = | 


—2 = 
Ea 1 


a-b a-b 
Calcule — y | — Ja 
a:a aa 


1 


4/3 
z 
2/3 


yd 
—1 


Encuentre un vector unitario u en la dirección de c. 
Demuestre que d es ortogonal a c. 


Utilice los resultados de los problemas de práctica 2 y 3 para explicar por qué d debe 


ser ortogonal al vector unitario u. 


6.1 EJERCICIOS 


En los ejercicios 1 a 8, determine las cantidades indicadas utilizando 0 —4 
los vectores 14. Calcule la distancia entre u = | —5 |yz=| —1 
—-1 4 
u= , v= , WwW=|-1]|, x=|-2 ah hit ; 5 
2 6 5 3 En los ejercicios 15 a 18, determine qué pares de vectores son 
ortogonales. 
v-u X-W 
1. u-u, v-uy — 2. W-W,X-Wy —— 8 5 12 2 
S K 15. a=] |»=[7 | 16. u=| 3|,v=|-=3 
1 1 -5 -3 =s 3 
3. ——w 4. —u 
W-wW uu 
3 —4 —3 1 
u.v X-W 
5. (==) 6. (Ox — 2 = 1 € 7 |8 
v-v EA 17. u=| ¿|y= 3 18. y= 4 Z=] 15 
7. |w 8. [xi e 9 0 = 


En los ejercicios 9 a 12, obtenga un vector unitario en la dirección 
del vector indicado. 


En los ejercicios 19 y 20, todos los vectores están en R”. Marque 
cada enunciado como verdadero o falso. Justifique sus respuestas. 


5 —30 ið a 19. a) vv = [v]P. 
` 40 ` 3 b) Para cualquier escalar c, u:(cv) = c(u:v). 

2/4 c) Si la distancia de u a v es igual a la distancia de u a —v, 

11 > 12 | 8/3 | entonces u y v son ortogonales. 
i 1 : 2 d) Para una matriz cuadrada A, los vectores en Col A son orto- 

gonales a los vectores en Nul A. 
13. Encuentre la distancia entre x = | 10 | yy= e | e) Si los vectores v;,..., V» generan un subespacio W y si x es 
-3 -5 ortogonal a cada v; para j = 1,..., p, entonces x está en W+. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


27. 


28. 


29. 


a) uv -vuu=0. 





b) Para cualquier escalar c, llev]| = cl|vl|. 


c) Six es ortogonal a cada vector en un subespacio W, entonces 
x está en W+. 


d) Si lulP + [lv]? = [lu + v| 


e) Si A es una matriz de m x n, los vectores en el espacio nulo 
de A son ortogonales a los vectores en el espacio fila de A. 





2, entonces u y v son ortogonales. 


Utilice la definición de transpuesta del producto interior para 
comprobar los incisos b) y c) del teorema 1. Mencione los 
hechos pertinentes del capítulo 2. 


Sea u = (u1, u2, u3). Explique por qué u:u = 0. ¿Cuándo 
uu = 0? 








2 =7 
Sean u = | —5 | y v= | —4 |. Calcule y compare u-v, [Jul?, 
-1 6 
ivil? y |u + v]]?. No utilice el teorema de Pitágoras. 
Compruebe la ley del paralelogramo para vectores u y v en R”: 


llu + v]P + [lu — vi? = 2lJulP? + 2I1vIP 
Sea v = pA Describa el conjunto H de vectores i que 


son ortogonales a v. [Sugerencia: Considere v = 0 y v +4 0]. 


5 
—6 |, y W el conjunto de todas las x en R? tales 
7 


que u:x = 0. ¿Qué teorema del capítulo 4 se puede utilizar 
para demostrar que W es un subespacio de [R3? Describa a W en 
lenguaje geométrico. 


Sean u = 


Suponga que un vector y que es ortogonal a los vectores u y V. 
Demuestre que y es ortogonal al vector u + v. 


Suponga que y es ortogonal a u y v. Demuestre que y es orto- 
gonal a cada w en Gen {u, v}. [Sugerencia: Una w arbitraria en 
Gen (u, v) tiene la forma w = c¡u + czy. Demuestre que y es 
ortogonal a dicho vector w]. 


w 
u 
oZ 
y 
v 
y) 
je 
pe 
Sea W = Gen {v1,..., Vp}. Demuestre que si x es ortogonal 


a cada v;, para 1 = ¡ S p, entonces x es ortogonal a todo vector 
en W. 


30. 


31. 
32. 


33. 


34. 
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Sean W un subespacio de R”, y W+ el conjunto de todos los 
vectores ortogonales a W. Demuestre que W+ es un subespacio 
de R”, considerando los siguientes pasos. 


a) Tome z en WŁ, y sea u cualquier elemento de W. Entonces 
zu = 0. Tome cualquier escalar c y demuestre que cz es 
ortogonal a u. (Puesto que u era un elemento arbitrario de 
W, esto demostrará que cz está en W+). 


b) Tome Z, y z2 en WŁ, y sea u cualquier elemento de W. 
Demuestre que zı + Z2 es ortogonal a u. ¿Qué se puede 
concluir acerca de z¡ + z2? ¿Por qué? 


c) Termine la demostración de que W+ es un subespacio de 
R”. 


Demuestre que si x está en W y W+, entonces x = 0. 


M] Construya un par u, v de vectores aleatorios en R4, y sea 
y p y 


O O RA 
A= LN TIAS: 


5-5 5.5 
| 55-53 .5 
a) Denote las columnas de A como a,..., as. Obtenga la lon- 


gitud de cada columna, y calcule a:a,, a¡:a3, a¡:as, maz, 
a2:ax y a3:as. 
b) Calcule y compare las longitudes de u, Au, v y Av. 


c) Utilice la ecuación (2) de esta sección para calcular el co- 
seno del ángulo entre u y v. Compare esto con el coseno del 
ángulo entre Au y Av. 


d) Repita los incisos b) y c) para otros dos pares de vectores 
aleatorios. ¿Qué se puede suponer del efecto de A sobre los 
vectores? 


[M] Genere vectores aleatorios x, y y v en R* con entradas en- 
teras (y v + 0), y calcule las cantidades 





xX-v yev &+y)vy (10x)-v 
E 
vev v-v Vev vev 


Repita los cálculos con nuevos vectores aleatorios x y y. 
X-V 

¿Qué se puede suponer acerca del mapeo x > T(x) = (=y 
vev 


(para v + 0)? Compruebe su suposición algebraicamente. 


—6 3 -27 -33 -13 
6 -—5 25 28 14 
[M] Sea A= 8&8 —6 34 38 18 |. Construya 


12 -10 50 4l 23 
14 -21 49 29 33 


una matriz N cuyas columnas formen una base para Nul A, y 
elabore una matriz R cuyas filas formen una base para Fil A 
(para detalles, véase la sección 4.6). Efectúe un cálculo matri- 
cial con N y R que muestre un hecho del teorema 3. 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


b 7 -b 7 = 
1. a'b =7, aa = 5. Así, “> = TE )a= a= a 





5 a:a 5 7/5 
4 
2. Escale c, multiplicando por 3 para obtener y = | —3 |. Calcule ||yl|? = 29 y |lyl| = v29. 
2 
4/429 
El vector unitario en la dirección de ¢ y y es u = iy? = | -3/429 |. 
y 2/4/29 
3. des ortogonal a e, porque 
5 4/3 
20 2 
d.c = 6 |- —1 O a 
—-1 2/3 


4. des ortogonal a u porque u tiene la forma kc para alguna k, y 


d-u =d- (ke) = k(d-e) = k(0) =0 


6.2 | CONJUNTOS ORTOGONALES 


Se dice que un conjunto de vectores (u;,..., u,) en RR” es un conjunto ortogonal si cada par 
de distintos vectores del conjunto es ortogonal, es decir, si uu; = O siempre que i + j. 


EJEMPLO 1 Demuestre que (u;, u>, uz) es un conjunto ortogonal, donde 


3 -1 -1/2 
X3 u; = 1 3 Uu = 2 4 uz = —2 
uo + 1 1 7/2 


' + SOLUCIÓN Considere los tres posibles pares de vectores distintos, a saber, {u;, u2}, (uy, 
' uz} y {W, u3}. 

um = 3(—1)+ 1(2)+1(1)=0 

uu; = 3 (—4) + 1-2) +1 (4) =0 

uu =-—1 (-3) +2(-2)+1(2) =0 








Cada par de vectores diferentes es ortogonal, y así (u;, u,, uz) es un conjunto ortogonal. 
FIGURA 1 Véase la figura 1; ahí los tres segmentos de recta son mutuamente perpendiculares. E 


TEOREMA 4 Si S = {u;,..., u} es un conjunto ortogonal de vectores distintos de cero en R”, en- 
tonces S es linealmente independiente y, por lo tanto, es una base para el subespacio 
generado por $. 


DEMOSTRACIÓN Si0 = cu + + CpU, para algunos escalares C,,..., Cy, entonces 
0 = 0-u; = (c10 + c20 + +++ + CyU,)-u 

(cu1)-u1 + (c702)-01 +++ + (cpUp)-u 

c¡(u -u) + c2(um-u1) +++: +cp(u),- u) 

= cı (u: u) 


ya que u; es ortogonal a uz,..., u,. Como u; es diferente de cero, entonces u;ʻu; no es cero 
y así cı = 0. De manera similar, c2,..., C, deben ser cero. Por lo tanto, S es linealmente in- 
dependiente. E 


DEFINICIÓN 


TEOREMA 5 
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Una base ortogonal para un subespacio W de R” es una base para W que también es 
un conjunto ortogonal. 


El siguiente teorema sugiere por qué una base ortogonal es mucho más agradable que 
otras bases. Los pesos en una combinación lineal se pueden calcular fácilmente. 


Sea (u,..., U,) una base ortogonal para un subespacio W de R”. Para cada y en W, los 
pesos en la combinación lineal 


y U + CpU, 


están dados por 
AS 


e = uru; (j= 1,...,p) 


DEMOSTRACIÓN Como en la demostración anterior, la ortogonalidad de {u;,..., Up} 
demuestra que 


yu = (C101 + C202 + +++ + CpUp)tU = C1 (U1 u) 


Puesto que u'u; no es cero, en la ecuación anterior se puede despejar cı. Para encontrar 
cj, considerando j = 2,..., p, calcule y-u; y despeje c;. E 


EJEMPLO 2 El conjunto S = {u;, u2, uz} del ejemplo 1 es una base ortogonal para R3. 





6 
Exprese el vector y = 1 | como una combinación lineal de los vectores en S. 
—8 
SOLUCIÓN Calcule 
yu =11, yu =-—12, y-uz = -33 
u u = 11, u-u = 6, u: W = 33/2 
Por el teorema 5, 
u u 
y= y-u i y-u y-u3 i 
ui’ U; u2° U2 uz. U3 
11 a -12 di 33 
= 7 + ——0) + 4 
1 6 BA 
=u- 2u = 2u3 E 


Observe qué fácil es obtener los pesos necesarios para construir y a partir de una base 
ortogonal. Si la base no fuera ortogonal, se necesitaría resolver un sistema de ecuaciones 
lineales para encontrar los pesos, como en el capítulo 1. 

A continuación se presenta una construcción que será un paso clave en muchos cálculos 
que implican ortogonalidad, y que conducirá a una interpretación geométrica del teorema 5. 


Una proyección ortogonal 


Dado un vector u distinto de cero en R”, considere el problema de descomponer un vector 
y en R” en la suma de dos vectores, siendo uno un múltiplo de u y el otro ortogonal a u. Se 
desea escribir 


YA (1) 
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Z=y-y y 
0| fzo u 
FIGURA 2 


Determinación de «a para hacer 
que y — Y sea ortogonal a u. 


donde $ = au para algún escalar q, y z es algún vector ortogonal a u. Véase la figura 2. 
Dado cualquier escalar œ, sea z = y — qu, tal que la ecuación (1) se satisface. Entonces 
y — fes ortogonal a u si y solo si 


0 = (y — 0u)-u = y-u— (0u)-u = y-u— a (u-u) 


Es decir, la ecuación (1) se satisface con z ortogonal a u si y solo si œ = _ y Y= a, 
El vector $ es la proyección ortogonal de y sobre u, y el vector z es la componente de y 
ortogonal a u. 

Si c es cualquier escalar distinto de cero y si u se remplaza por cu en la definición 
de $, entonces la proyección ortogonal de y sobre cu coincide exactamente con la proyec- 
ción ortogonal de y sobre u (ejercicio 31). De ahí que esta proyección esté determinada 
por el subespacio L generado por u (la recta que pasa por u y 0). Algunas veces $ se de- 
nota como proy, y, y se llama la proyección ortogonal de y sobre £. Es decir, 


Al > y'u 
y = proj; y = —u 2) 
uu 


EJEMPLO 3 Sean y= [| yu= H Encuentre la proyección ortogonal de y so- 


bre u. Después escriba y como la suma de dos vectores ortogonales, uno en Gen {u} y el otro 
ortogonal a u. 


SOLUCIÓN Calcule 


La suma de esos dos vectores es y. Es decir, 


7 8 -1 
[l-k] 
T T 

y y (y - Y) 

En la figura 3 se muestra esta descomposición de y. Nota: Si son correctos los cálculos an- 
teriores, entonces ($, y — Y) será un conjunto ortogonal. Para comprobarlo, determine 


po=p= [4 7 ]-.+.-0 E 


Como el segmento de recta de la figura 3 entre y y $ es perpendicular a L, por cons- 
trucción de $, entonces el punto identificado con $ es el punto más cercano de L a y. (Esto 
se puede demostrar con geometría. Ahora se supondrá esto para R? y en la sección 6.3 se 
demostrará para R”). 
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FIGURA 3 La proyección ortogonal de y sobre una 
recta L que pasa por el origen. 


EJEMPLO 4 En la figura 3 encuentre la distancia de y a L. 


SOLUCIÓN La distancia de y a L es la longitud del segmento de recta perpendicular de y a 
la proyección ortogonal y. Esta longitud es igual a la longitud de y — $. Así, la distancia es 


ly- ĵi = VEND? +2 = v5 n 


Una interpretación geométrica del teorema 5 


En la ecuación (2), la fórmula para la proyección ortogonal Y tiene la misma apariencia que 
cada uno de los términos en el teorema 5. Así, el teorema 53 descompone un vector y en una 
suma de proyecciones ortogonales sobre subespacios unidimensionales. 

Es fácil visualizar el caso en el cual W = R? = Gen {u;, u2}, con u; y w ortogonales. 
Cualquier y en R? se puede escribir en la forma 








y-u e y:u 6) 
u’ Uj u2° W2 

El primer término en (3) es la proyección de y sobre el subespacio generado por u; (la recta 
que pasa por u; y por el origen), y el segundo término es la proyección de y sobre el subespa- 
cio generado por u». Así, la ecuación (3) expresa a y como la suma de sus proyecciones sobre 
los ejes (ortogonales) determinados por u; y u2. Véase la figura 4. 


u5 


(Y, = proyección sobre u 


a sobre u 
FIGURA 4 Un vector descompuesto en 
la suma de dos proyecciones. 


1 


u 


El teorema 5 descompone a cada y en Gen (u;,..., u,) en la suma de p proyecciones 
sobre subespacios unidimensionales que son mutuamente ortogonales. 
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FIGURA 6 


Descomposición de una fuerza en sus componentes 


La descomposición que se ilustra en la figura 4 se presenta en física cuando se aplica una 
fuerza a un objeto. La elección de un sistema de coordenadas adecuado permite que la fuerza 
se represente con un vector y en [R? o [R3, Con frecuencia el problema implica alguna direc- 
ción particular de interés, que queda representada por otro vector u. Por ejemplo, si el objeto se 
está moviendo en línea recta cuando se aplica la fuerza, entonces el vector u podría apuntar en 
la dirección de movimiento, como se muestra en la figura 5. Un paso clave en el problema 
es descomponer la fuerza en una componente en la dirección de u y en una componente orto- 
gonal a u. Los cálculos serían análogos a los realizados en el ejemplo 3 anterior. 





FIGURA 5 


Conjuntos ortonormales 


Un conjunto (u;,..., u,) es un conjunto ortonormal si es un conjunto ortogonal de vectores 
unitarios. Si W es el subespacio generado por tal conjunto, entonces (u;,..., u,) es una base 
ortonormal para W, porque el conjunto es linealmente independiente de manera automática, 
de acuerdo con al teorema 4. 

El ejemplo más sencillo de un conjunto ortonormal es la base estándar (e;,..., €,) 
para R”. Cualquier subconjunto no vacío de (e;,..., e, ) también es ortonormal. A continua- 
ción se presenta un ejemplo más complicado. 


EJEMPLO 5 Demuestre que {v1, V2, V3} es una base ortonormal de R3, donde 


3/41 -1/46 1/66 
vN=|1/V401 |. v=| 2/46 |. v3=| -4/466 
14/11 1/46 7/4/66 


SOLUCIÓN Calcule 


vivo =-3/V66 +2/V66 + 1/V66 = 0 
vi v3 = —3/ 4/726 — 4/4/1726 + 71/4/26 = 0 
v2+V3 = 1/4396 — 8/396 + 7/4396 = 0 


Así {v1, V2, V3} es un conjunto ortogonal. Además, 


viví = 9/11 + 1/11 + 1/11 =1 
va Va =1/6+4/6+1/6= 1 
v3-v3 = 1/66 + 16/66 + 49/66 = 1 
que muestra que V1, V2 y V3 son vectores unitarios. Así, {V1, V2, V3} es un conjunto ortonormal. 


Como el conjunto es linealmente independiente, entonces sus tres vectores forman una base 
para R°. Véase la figura 6. E 


TEOREMA 6 


TEOREMA 7 
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Cuando los vectores en un conjunto ortogonal de vectores distintos de cero se normalizan 
para que tengan longitud unitaria, entonces los nuevos vectores seguirán siendo ortogonales, 
por lo que el nuevo conjunto será un conjunto ortonormal. Véase el ejercicio 32. En la figura 
6 (ejemplo 5) es sencillo comprobar que los vectores son simplemente los vectores unitarios 
en las direcciones de los vectores de la figura 1 (ejemplo 1). 

Las matrices cuyas columnas forman un conjunto ortonormal son importantes en apli- 
caciones y en algoritmos computacionales para cálculos matriciales. Sus propiedades funda- 
mentales se exponen en los teoremas 6 y 7. 


Una matriz U de m x n tiene columnas ortonormales si y solo si UTU =1. 


DEMOSTRACIÓN Para simplificar la notación, suponga que U solo tiene tres columnas, 
cada una un vector en R”. En esencia, la demostración del caso general es la misma. Sea 
U = [u; w u3] y calcule 


ul uu uu uu; 
T 
U'U = | u? |[u u u]=|u/0, uu uu (4) 
T T T T. 
u; uu uu uu 


Las entradas en la matriz de la derecha son productos interiores, empleando la notación trans- 
puesta. Las columnas de U son ortogonales si y solo si 


uu = uu =0, uu; = uu =0, uu; = uu =0 (5) 

Todas las columnas de U tienen longitud unitaria si y solo si 
Wu =1, Ww =l, ww =l (6) 
El teorema se deduce inmediatamente de las ecuaciones (4) a (6). E 


Sea U una matriz de m x n con columnas ortonormales, y x y y están en R”. 
Entonces, 


a) |Ux|| =||x]| 
b) (Ux): (Uy) = x:y 
c) (Ux): (Uy) = 0 si y solo si x:y = 0 


Las propiedades a) y c) dicen que el mapeo lineal x > Ux preserva longitudes y or- 
togonalidad. Esas propiedades son importantes para muchos algoritmos computacionales. 
Véase el ejercicio 25 para la demostración del teorema 7. 


1/42 2/3 Ja 
EJEMPLO 6 SeanU=| 1/42 -2/3 |y x= | ej Observe que U tiene colum- 
0 1/3 


nas ortonormales y 


= O 
LE 


23 213 1/3 || YY 2/13 |= 


aa ls 1/42 ha A 7 f 


Compruebe que ||Ux|| = ||xll. 
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6.2 


EJERCICIOS 


SOLUCIÓN 
1/42 2/3 3 
Ux=| 1/42 -2/3 ki 
0 1/3 


[Ux|| =V9+1+1= V11 
Ixl = V2¥ 9 = VTI E 


Los teoremas 6 y 7 son particularmente útiles cuando se aplican a matrices cuadradas. 
Una matriz ortogonal es una matriz cuadrada invertible U tal que U”! = UT. De acuerdo 
con el teorema 6, tal matriz tiene columnas ortonormales.' Es fácil ver que cualquier ma- 
triz cuadrada con columnas ortonormales es una matriz ortogonal. De manera sorprendente, 
dicha matriz también debe tener filas ortonormales. Véase los ejercicios 27 y 28. En el capí- 
tulo 7 se presentarán con frecuencia matrices ortogonales. 


EJEMPLO 7 La matriz 


3/W11 —1/V6 —1/4V66 
U=| 1/11 2/46 -4/v66 
1/ VII 1/46 7/466 


es una matriz ortogonal porque es cuadrada y porque sus columnas son ortonormales, de 
acuerdo con el ejemplo 5. Compruebe que las filas ¡también sean ortonormales! E 


PROBLEMAS DE PRÁCTICA 


TUE 12/45 
1. Sean u; = | 2 y U) = | 1/45 . Demuestre que (u;, u>) es una base ortonor- 


mal para R?. 


2. Sean y y L como en el ejemplo 3 y en la figura 3. Calcule la proyección ortogonal $ 


de y sobre L utilizando u = | 7 


1 | en lugar de u del ejemplo 3. 


3. Sean U y x como en el ejemplo 6, y y = P Compruebe que Ux-Uy = x-y. 


En los ejercicios 1 a 6, determine qué conjuntos de vectores son 3 —1 3 5 —4 3 
ortogonales. 5 -2 3 8 6 —4 1 3 
i 1p] -317 Ú opp 5 
-1 5 3 1 0 ==) 3 4 0 3 8 -1 

3 1 7 1 2 1 En los ejercicios 7 a 10, demuestre que (u;, uz) o (u;, u, uz) son 


a| 


2 
=1 
-1 


H 


—6 
3 
9 


H 


3 
1 
-1 


una base ortogonal para R? o R3, respectivamente. Después exprese 
x como una combinación lineal de los vectores u. 


Ll Mé HA] +) 17] 


1 Un mejor nombre sería matriz ortonormal, y este término se emplea en algunos textos de estadística. Sin embargo, 
matriz ortogonal es el término estándar en álgebra lineal. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


u; = 
1 -1 2; 8 
u=|0/,u= 4 |, u; = l|yx=| -4 
1 1 —2 —3 
3 2 5 
u = | —3 |, u = 2 |, u = yx=|-3 
0 -1 1 


Calcule la proyección ortogonal de | : | sobre la recta que pasa 


pa 
por| >| ypor el origen. 


. 1 
Calcule la proyección ortogonal de E | sobre la recta que 


pasa por | 3 | y por el origen. 


Sean y = [5] yu= j | Escriba y como la suma de dos 


vectores ortogonales, uno en Gen (u) y el otro ortogonal a u. 


Sean y = lá y u= Ed Escriba y como la suma de un 


vector en Gen {u} y un vector ortogonal a u. 


Sean y = | i | yu= | A! Calcule la distancia de y a la recta 


que pasa por u y el origen. 


=3 1 
Sean y = | J yu= El Calcule la distancia de y a la 


recta que pasa por u y el origen. 


En los ejercicios 17 a 22, determine cuáles conjuntos de vectores son 
ortonormales. Si un conjunto solamente es ortogonal, normalice los 
vectores para obtener un conjunto ortonormal. 


17. 


19. 


21. 


22. 


1/37 T-1/2 0 0 
13l] 0 18. 1l, -1 
1/3 1/2 0 0 

2/31 T 1/3 

A 20. | 1/3 |,| 2/3 

BIL 213110 


1/410 
3/120 |, 
3/1/20 


3/4/10 0 
=1/420 |, | -1/42 
1/1/20 1/42 


1/4/18 1/42 -2/3 
4/418 |, 0o |,| 1⁄3 
1/418 -1/42 -2/3 


En los ejercicios 23 y 24, todos los vectores están en R”. Marque 
cada enunciado como verdadero o falso. Justifique sus respuestas. 


23. 


a) No todo conjunto linealmente independiente en R” es un 
conjunto ortogonal. 


24. 


25. 


2 


27. 


2 


29. 


30. 


w 


32. 


34. 


6. 


8. 


1. 
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b) Si y es una combinación lineal de vectores distintos de cero 
de un conjunto ortogonal, entonces los pesos en la combi- 
nación lineal se pueden calcular sin operaciones de fila so- 
bre una matriz. 


c) Si se normalizan los vectores en un conjunto ortogonal de 
vectores distintos de cero, entonces tal vez algunos de los 
nuevos vectores no sean ortogonales. 

d) Una matriz con columnas ortonormales es una matriz 
ortogonal. 

e) Si L es una recta que pasa por 0 y si Y es la proyección orto- 
gonal de y sobre L, entonces ||$[| da la distancia de y a L. 


a) No todo conjunto ortogonal en R” es linealmente indepen- 
diente. 

b) Si un conjunto S = (u;,..., U,) tiene la propiedad de que 
uru; = 0 siempre que i + j, entonces S es un conjunto orto- 
normal. 


c) Si las columnas de una matriz A de m x n son ortonormales, 
entonces el mapeo lineal x > Ax preserva longitudes. 


d) La proyección ortogonal de y sobre v es igual a la proyec- 
ción ortogonal de y sobre cv siempre que c + 0. 


e) Una matriz ortogonal es invertible. 
2 








Demuestre el teorema 7. [Sugerencia: Para a), calcule ||Uxl 
O primero demuestre b)]. 


Suponga que W es un subespacio de R” generado por n vectores 
ortogonales distintos de cero. Explique por qué W = R”. 


Sea U una matriz cuadrada con columnas ortonormales. Explique 
por qué U es invertible. (Mencione los teoremas que utilice). 


Sea U una matriz ortogonal de n x n. Demuestre que las filas de 
U forman una base ortonormal de R”. 


Sean U y V matrices ortogonales de n x n. Explique por qué 
UV es una matriz ortogonal. [Es decir, explique por qué UV 
es invertible y su inversa es (UV)7]. 


Sea U una matriz ortogonal; construya V intercambiando al- 
gunas de las columnas de U. Explique por qué V es una matriz 
ortogonal. 


Demuestre que la proyección ortogonal de un vector y sobre 
una recta L que pasa por el origen en R? no depende de la elec- 
ción del vector u diferente de cero en L que se emplea en la 
fórmula para $. Para hacer esto, suponga que y y u están da- 
dos y que $ se calculó mediante la fórmula (2) de esta sección. 
Sustituya u en tal fórmula por cu, donde c es un escalar distin- 
to de cero no especificado. Demuestre que la nueva fórmula da 
el mismo valor para $. 


Sean (vi, v2) un conjunto ortogonal de vectores distintos de 
cero, y c1, cz escalares diferentes de cero. Demuestre que [c,v1, 
c2V2) también es un conjunto ortogonal. Como la ortogonalidad 
de un conjunto está definida en términos de pares de vectores, 
esto demuestra que si se normalizan los vectores en un conjunto 
ortogonal, el nuevo conjunto seguirá siendo ortogonal. 


. Dado u + 0 en R”, sea L = Gen (u). Demuestre que el mapeo 


X > proy, Xx es una transformación lineal. 





Dado u + 0 en R”, sea L = Gen {u}. Para y en R”, la reflexión 
de y en L es el punto refl, y definido por 


refl; y = 2-proyz y — y. 
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Véase la figura, que indica que refl, y es la suma de Y = proy, y 6 3 6 1 
y Y — y. Demuestre que el mapeo y +> refl; es una transfor- -1 2 1-6 
mación lineal. 3 6 3 -2 
6-3 6 -l 
a y A a 
T N L= Gen{u} => $ 3 7 
T iz 2-1 2-3 
A 

+ <$ 1.2 1 6 

Sá le a refl, y 36. [M] En los incisos a) a d), sea U la matriz formada por la nor- 

L 5 malización de cada columna de la matriz A del ejercicio 35. 
y A Eo a) Calcule UTU y UU”. ¿En qué difieren? 
1 
b) Genere un vector aleatorio y en R$, y determine p = UUTy 


x y z = y — p. Explique por qué p está en Col A. Compruebe 
soy que z sea ortogonal a p. 


La'reflexión de y gi:undtecta due pasa por elorigen, c) Compruebe que z es ortogonal a cada columna de U. 


35. [M] Demuestre que las columnas de la matriz A son ortogonales d) Observe que y = p + z, con p en Col A. Explique por qué 
haciendo el cálculo matricial adecuado. Especifique el cálculo z está en (Col 4)”. (En la siguiente sección se explicará el 
que realizó. significado de esta descomposición de y). 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Los vectores son ortogonales porque 
u; '* U2 = —2/5 + 2/5 =0 


Son unitarios porque 


[uy 1? = (1/45? + Q/V5? =1/5+4/5=1 
[w1? =Q/V5? + (1/45? =4/5+ 1/5=1 


En particular, el conjunto {u;, u2} es linealmente independiente y, por lo tanto, es una 
base para R? porque hay dos vectores en el conjunto. 


2. Cuando y = H yu= 1 


a 20 21_42|_[8 

aa el a Ala 
Esta es la misma Y que se encontró en el ejemplo 3. La proyección ortogonal no parece 
depender de la u seleccionada sobre la recta. Véase el ejercicio 31. 


3 Uy =:01/42-=2/3 6 -7 


1/ V2 2/3 EE 1 
0 1/3 paje 2 


3 
También, del ejemplo 6, x = | a y Ux = | —1 |. Por lo tanto, 
1 


Ux-Uy=3+7+2=12 y xy=-6+18= 12 
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6.3 | PROYECCIONES ORTOGONALES 


W 
FIGURA 1 


E O 


La proyección ortogonal de un punto en RR? sobre una recta que pasa por el origen tiene una 
importante analogía en R”. Dado un vector y y un subespacio W en [R”, existe un vector Y 
en W tal que 1. $ es el único vector en W para el cual y — $ es ortogonal a W, y 2. f es el 
único vector en W más cercano a y. Véase la figura 1. Estas dos propiedades de $ dan la 
clave para encontrar las soluciones de mínimos cuadrados de sistemas lineales, que se men- 
cionaron en el ejemplo introductorio de este capítulo. En la sección 6.5 se contará la his- 
toria completa. 

Como preparación para el primer teorema, observe que siempre que un vector y se re- 
presenta como una combinación lineal de vectores u;,..., u, en R”, los términos en la suma 
para y se pueden agrupar en dos partes de manera que y se representa como 


y=2Z1+2 


donde z¡ es una combinación lineal de algunas u;,, y z, es una combinación lineal de las u; 
restantes. Esta idea es útil en particular cuando (u;,..., U,) es una base ortogonal. De la 
sección 6.1 recuerde que W+ denota el conjunto de todos los vectores ortogonales a un sub- 
espacio W. 


EJEMPLO 1 Sea (u;,..., us) una base ortogonal para R* y 
y = ct + e + csUs 


Considere el subespacio W = Gen {u;, u2}, y escriba y como la suma de un vector zı en W 
y un vector z2 en W+. 


SOLUCIÓN Escriba 


y = C1Uı + C2U2 + C3U3 + C4U4 + C5U5 


pa = 
Zı Z2 








ym 


donde Zz¡= c¡u¡ + c2u está en Gen {u;, u2} 


y Z2 = c3U3 + c4U4 + csUs; está en Gen (uz, us, us). 


Para demostrar que z2 está en W+, es suficiente probar que z2 es ortogonal a los vectores en 
la base {u;, u2} para W. (Véase la sección 6.1). Utilizando propiedades del producto interior, 
calcule 


Z2'U] = (C303 + C4U4 + C5U5)-u; 


C3U3+ U; + C4U¿+ U + C5U5+ Uy 
=0 


ya que u; es ortogonal a uz, uy y us. Un cálculo similar indica que z>uz = 0. Así, Z? está 
en WŁ. E 


El siguiente teorema demuestra que la descomposición y = Zı + z) del ejemplo 1 se 
puede calcular sin tener una base ortogonal para R”. Es suficiente con tener una base orto- 
gonal solo para W. 
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TEOREMA 8 


Teorema de descomposición ortogonal 


Sea W un subespacio de R”. Entonces toda y en R” se puede escribir de forma única 
como 


y=$+z a) 


donde Y está en W y z está en W”. De hecho, si (u;,..., u,) es cualquier base ortogonal 
de W, entonces 

Uj u 
A E 
u'u; up'up 








i u, 2) 


El vector $ en la ecuación (1) es la proyección ortogonal de y sobre W, y con frecuen- 
cia se escribe como proyw y. Véase la figura 2. Cuando W es un subespacio unidimensional, 
la fórmula para coincide con la fórmula que se presentó en la sección 6.2. 


plomo 


Y = proy y y 
w 


FIGURA 2 Proyección ortogonal de y 
sobre W. 


DEMOSTRACIÓN Sea (u;,..., u,) una base ortogonal para W, y defina $ con la ecua- 
ción (2).! Entonces $ está en W porque Y es una combinación lineal de la base u;,..., up. 


Sea z = y — $. Como u; es ortogonal a u,,..., Up, entonces a partir de la ecuación (2) se 
deduce que 


y-u 





zu = y- $u = yeu — ( Juu -0-0 


u-u 


= yu -yu = 0 


Por lo tanto, Z es ortogonal a u;. De manera similar, z es ortogonal a cada u; en la base para 
W. Por consiguiente, z es ortogonal para todo vector en W. Es decir, z está en W+. 

Para demostrar que la descomposición en la ecuación (1) es única, suponga que y se 
puede escribir como y = ĵı + zı con ĵı en W, y zı en W+. Entonces Y + z = $1 + z; (ya que 
ambos lados son iguales a y), y así 


Y-$Y=2Z,-2Z 


Esta igualdad indica que el vector v = y — $1 está en W y en W+ (porque zZ; y z están ambos 
en W-, y W+ es un subespacio). Por lo tanto, v:v = 0, lo que demuestra que v = 0. Esto prue- 
ba que y = $ y también que z; = Z. E 


La unicidad de la descomposición (1) demuestra que la proyección ortogonal Y solo 
depende de W y no de la base particular empleada en la ecuación (2). 


1 Se puede suponer que W no es el subespacio cero porque, de otra forma, W+ = R” y la ecuación (1) simplemente 
sería y = 0 + y. En la siguiente sección se demostrará que cualquier subespacio distinto de cero de R” tiene una 
base ortogonal. 
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2 —2 1 
EJEMPLO 2 Sean u = 5 |, u = 1 |y y=] 2 |. Observe que {u;, u2} es 
—1 1 3 


una base ortogonal para W = Gen {u;, u2}. Escriba y como la suma de un vector en W y 
de un vector ortogonal a W. 


SOLUCIÓN La proyección ortogonal de y sobre W es 





Pi -u . 
y= Y" Lu + pa u2 
u.’ Ul u2° U2 
2 —2 2 —2 —2/5 
9 3 9 15 
= — 5+- 1| =— 5+ l | = 2 
30 -1 6 1 30 1 30 1 1/5 
Además, 
1 2/5 7/5 
y-y=|2|- 2 = 0 
3 1/5 14/5 


El teorema 8 asegura que y — $ está en W-. Sin embargo, para comprobar los cálculos, es 
una buena idea comprobar que y — $ es ortogonal a u; y u», y por lo tanto a toda W. 
La descomposición deseada de y es 


1 2/5 7/5 
y=|2|= 2 |+| 0 n 
3 1/5 14/5 


Interpretación geométrica de la proyección ortogonal 


Cuando W es un subespacio unidimensional, la fórmula (2) para proyy y solo contiene un 
término. Así, cuando dim W > 1, cada término de la ecuación (2) es en sí mismo una pro- 
yección ortogonal de y sobre el subespacio unidimensional generado por uno de los vectores 
u en la base para W. La figura 3 muestra esto cuando W es un subespacio de R? generado 
por u; y u2. Aquí, $; y $2 denotan las proyecciones de y sobre las rectas generadas por u; 
y u, respectivamente. La proyección ortogonal de y sobre W es la suma de las proyec- 
ciones de y sobre subespacios unidimensionales que son ortogonales entre sí. El vector Y 
en la figura 3 corresponde al vector y de la figura 4 de la sección 6.2, porque ahora es y el 
que está en W. 





y 
A 
en 
A u, 
7 : ye 

M 

bET 

A i 
' y= pa N2 a =Y +$ 
0 gat J= upa t ma 25AN 


FIGURA 3 La proyección ortogonal de y es la suma de 
sus proyecciones sobre subespacios unidimensionales 
que son mutuamente ortogonales. 
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Propiedades de proyecciones ortogonales 


Si (u;¡,..., U,) es una base ortogonal para W y resulta que y está en W, entonces la fórmula 
para proyw y es exactamente la misma que la representación de y en el teorema 5 de la sección 
6.2. En este caso, proyw y = y. 


Si y está en W = Gen (u;,..., U,), entonces proyy y = y. 


Este resultado también se deduce del siguiente teorema. 


TEOREMA 9 Teorema de la mejor aproximación 


W es un subespacio de [R”, y es cualquier vector en [R”, y Yes la proyección ortogonal de 
y sobre W. Entonces $ en W es el punto más cercano a y, en el sentido de que 


ly — $ <lly — vil 6) 


para toda v en W diferente de $. 


El vector Y del teorema 9 se llama la mejor aproximación a y por elementos de W. 
En secciones posteriores del libro se examinarán problemas donde una y dada se debe rem- 
plazar, o aproximar, mediante un vector v en algún subespacio W fijo. La distancia de y a v, 
dada por ly — vll, se puede considerar como el “error” de usar v en lugar de y. El teorema 9 
afirma que este error se minimiza cuando v = f. 

La desigualdad (3) conduce a una nueva demostración de que Y no depende de la base 
ortogonal particular empleada para calcularlo. Si se utilizara una base ortogonal diferente 
para W con la finalidad de construir una proyección ortogonal de y, entonces esta proyección 
también sería el punto en W más cercano a y, a saber, $. 





DEMOSTRACIÓN Tome v en W diferente de $. Véase la figura 4. Entonces Y — v está en W. 
De acuerdo con el teorema de descomposición ortogonal, y — Yes ortogonal a W. En particu- 
lar, y — $ es ortogonal a Y — v (que está en W). Puesto que 


y-V=(Y-Y)+6-v) 
entonces, al utilizar el teorema de Pitágoras, se obtiene 
ly- vl? = ly- ÎI? + (19 — vi 


(Véase el triángulo rectángulo a la derecha de la figura 4. Se indica la longitud de cada 
lado). Ahora || — v||? > 0 porque Y — v + 0, y así se deduce inmediatamente la desi- 
gualdad (3). E 





Iy- ĝl 
YD 
I$- vil 


lly — vil 


WwW 


FIGURA 4 La proyección ortogonal de y sobre 
W es el punto en W más cercano a y. 
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2 -2 1 
EJEMPLO 3 Siu = 5 |, u = 1 |, y= | 2 |y W= Gen {u;, u2}, como en 
-1 1 3 
el ejemplo 2, entonces el punto en W más cercano a y es 
yu yu a 
y= u+ 2 w = 2 E 
u-u u2° U2 1/5 


EJEMPLO 4 La distancia de un punto y en R” a un subespacio W se define como la 
distancia de y al punto más cercano en W. Encuentre la distancia de y a W = Gen {u}, u2}, 


donde 
—1 5 1 
y=|35|, u=|-2|, u= 
10 1 —1 


SOLUCIÓN De acuerdo con el teorema de la mejor aproximación, la distancia de y a W es 
lly — 3, donde Y = proyw y. Ya que (u¡, u>) es una base ortogonal para W, 


5 1 —1 
A. 15 1 7 
Y = —u + — wu = -| —2 |---| 2|=]|-—8 
30 6 2 1 2| 4 
-1 —1 0 
y-$=|-5|-|-8|=]3 
10 4 6 
ly =$? =3 +6 =45 
La distancia de y a Wes V45 = 345. E 


El teorema final en esta sección muestra cómo la fórmula (2) para proyw y se simpli- 
fica cuando la base para W es un conjunto ortonormal. 


TEOREMA 10 Si {u;,..., Up} es una base ortonormal para un subespacio W de R”, entonces 
proywy = (y-u1)u; + (y:U2)u) + +++ + (y:U,)u, (4) 
Si U = [uy u» -** u,], entonces 


proywy = UUTy para toda y en R” (5) 


DEMOSTRACIÓN La fórmula (4) se obtiene inmediatamente de la ecuación (2) del 
teorema 8. Además, la ecuación (4) indica que proyw y es una combinación lineal de las 
columnas de U empleando los pesos y-u;, y-u»,..., y"U,. Los pesos se pueden represen- 
tar como uly, u} Y... 05y, probando que son las entradas en Ufy, y justificando la 
ecuación (5). E 


Suponga que U es una matriz de n x p con columnas ortonormales, y sea W el espacio 
columna de U. Entonces, 


UTUx=I,x=x  paratodaxen[R? Teorema 6 
UUTy = proywy para toda yen R” Teorema 10 
Si U es una matriz (cuadrada) de n x n con columnas ortonormales, entonces U es una matriz 
ortogonal, el espacio columna W es todo de R”, y UUTy = Iy = y para toda y en R”. 
Aunque la fórmula (4) es importante para fines teóricos, en la práctica generalmente 


implica algunos cálculos con raíces cuadradas de números (en las entradas de u;). La fórmula 
(2) se recomienda para cálculos a mano. 
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PROBLEMA DE PRÁCTICA 


—7 
Sean u; = 1 


—1 —9 
1], y= 1 | y W = Gen {u;, u2}. Con base en el hecho 
—2 6 


de que u; y uz son ortogonales, calcule proyw y. 


6.3 EJERCICIOS 


En los ejercicios 1 y 2, se puede suponer que (u;,..., U4) es una base 
ortogonal para R4. 


0 3 1 5 
1 2 1 p3 = 0 N 
wS 4 | W = 1P uz; = 1P u= 
—1 1 —4 1 
10 
x= E . Escriba x como la suma de dos vectores, uno 
0 


en Gen (u;, u>, uz) y el otro en Gen (us). 


A A A 
IAEA 


4 

5 s 
y= 3 1 Escriba v como la suma de dos vectores, uno en 
3 | 


Gen {u;} y el otro en Gen (u», uz, us). 


En los ejercicios 3 a 6, compruebe que {u:1, u2} es un conjunto or- 
togonal, y luego encuentre la proyección ortogonal de y sobre Gen 


{u;, u2}. 


—1 —1 
3. y= 4 |,u = UY = 1 
3 0 
6 3 —4 
4. y= 3j, u=] 4], = 3 
—2 0 0 
—1 3 1 
5. y= 2,0 =|-—1 [um =|-—l 
6 2 —2 
6 —4 0 
6. y= 4 , U = —1 , U2 = 1 
1 1 1 


En los ejercicios 7 a 10, sea W el subespacio generado por los vec- 
tores u, y escriba y como la suma de un vector en W y un vector 
ortogonal a W. 


—1 1 —1 
8 y= 4 , U = 1 , U2 = 3 
3 1 —2 
aa la 
3 1 3 0 
9 y= 3 pujo p= 1 p3 = 1 
A E A ME 
3 1 1 0 
4 1 0 —-1 
10. y= 5 YY = 0 Ù = 1 >, U3 = 1 
6 —1 1 —1 


En los ejercicios 11 y 12, determine el punto más cercano a y en el 
subespacio W generado por v1 y v2. 


3 1 
11. y= M=|_ a p= zi 
1 —1 
3 1 —4 
12. y= E Yi = A Yo = a 
13 2 3 


En los ejercicios 13 y 14, calcule la mejor aproximación a z con vec- 
tores de la forma c¡v¡ + c2v2. 


7 i i| 
—7 —1 1 
13. z= 2 pY , Ya = 0 


3] 1] a 


2 2 5 
4 0 —2 
14. z= geim E hS 4 
-1 -3 2 
5 —3 —3 
15. Sean y = | —9 |, u = | —5 |, u = 2 |. Encuentre la 
5 1 1 


distancia de y al plano en R? generado por u; y u2. 


16. Sean y, v¡ y v2 como en el ejercicio 12. Encuentre la distancia 
de y al subespacio de [R* generado por v; y va. 


4 2/3 9/3 
17. Sean y=|8|, u4=]|1/3|, ù= 2/3 y 
1 2/3 1/3 


W = Gen {u}, W2}. 


18. 


19. 


20. 


a) Sea U = [u; w]. Calcule UTU y UU”. 
b) Calcule proyw y y (UUT)y. 


27 a 1/410 z 
Sean y = BE = [a w= Gen {u1}. 
a) Sea U la matriz de 2 x 1 cuya única columna es u;. Calcule 
UTU y UU". 
b) Determine proyw y y (UU” yy. 


1 5 0 
Sean u; = 1 |, u = | —1 | y u = | 0 |. Observe que 
—2 2 1 


u; y u son ortogonales, pero que uz no es ortogonal a u; o u». 
Es posible demostrar que uz no está en el subespacio W gene- 
rado por u; y u2. Con base en este hecho, construya un vector v 
diferente de cero en R3 que sea ortogonal a u; y u». 


0 
Sean u; y u? como en el ejercicio 19, y u4 = | 1 
0 


. Es posi- 


ble demostrar que us no está en el subespacio W generado por 
u; y u2. Con base en este hecho, obtenga un vector v diferente 
de cero en R? que sea ortogonal a u; y uz. 


En los ejercicios 21 y 22, todos los vectores y subespacios están 
en R”. Marque cada enunciado como verdadero o falso. Justifique 
sus respuestas. 


21. 


a) Si z es ortogonal a u; y a u2, y si W = Gen {u;, u2}, enton- 
ces z debe estar en W-. 


b) Para cada y y cada subespacio W, el vector y — proyy y 
es ortogonal a W. 


c) Algunas veces $, la proyección ortogonal de y sobre un 
subespacio W, puede depender de la base ortogonal de W 
empleada para calcular $. 


d) Si y está en un subespacio W, entonces la proyección orto- 
gonal de y sobre W es y misma. 


23. 


24. 


25. 


26. 
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e) Si las columnas de una matriz U de n x p, son ortonorma- 
les, entonces UU” y es la proyección ortogonal de y sobre 
el espacio columna de U. 


. a) Si W es un subespacio de R” y si v está en W y en W+, en- 


tonces v debe ser el vector cero. 


b) En el teorema de descomposición ortogonal, cada término 
en la fórmula (2) para $ es en sí mismo una proyección de y 
sobre un subespacio de W. 


c) Si y = Zz; + z, donde z; está en un subespacio W y z? está 
en WŁ, entonces zı debe ser la proyección ortogonal de y 
sobre W. 


d) La mejor aproximación a y por elementos de un subespacio 
W está dada por el vector y — proywy y. 


e) Si una matriz U de n x p, tiene columnas ortonormales, en- 
tonces UUTx = x para toda x en R”. 


Sea A una matriz de m x n. Demuestre que cada vector x en R” 
se puede escribir en la forma x = p + u, donde p está en Fil A 
y u pertenece a Nul A. Además, demuestre que si la ecuación 
Ax = b es consistente, entonces existe una única p en Fil A tal 
que Ap = b. 


Sea W un subespacio de [R” con una base ortogonal (w;,..., Wp}, 

y sea {V1,..., Vq} una base ortogonal para W+. 

a) Explique por qué (w;,..., Wp, V1»--., Vg} es un conjunto or- 
togonal. 

b) Explique por qué el conjunto del inciso a) genera a R”. 


c) Demuestre que dim W + dim W+ = n. 


[M] Sea U la matriz de 8 x 4 del ejercicio 36 de la sección 6.2. 
Encuentre el punto más cercano a y = (1, 1, 1, 1, 1, 1, 1, 1) en 
Col U. Escriba las instrucciones que utilizó para resolver este 
problema. 


[M] Sea U la matriz del ejercicio 25. Obtenga la distancia de b 
=(1,1,1,1,—1,—1,—1, —1) a Col U. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Calcule 


proyw y 





y-u y-U 88 dl —2 
= u u = u u 

u-u u2° U2 2 66 , 6 2 
= — — — = = y 

31 4 =D 6 


En este caso, y resulta ser una combinación lineal de u; y u2, de manera que y está en W. 
El punto en W más cerca de y es y misma. 
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6.4 | PROCESO DE GRAM-SCHMIDT 


% 


FIGURA 1 
Construcción de una base 
ortogonal (v;, va). 


El proceso de Gram-Schmidt es un sencillo algoritmo para obtener una base ortogonal u 
ortonormal para cualquier subespacio diferente de cero de R”. Los dos primeros ejemplos 
de este proceso son para realizarse a mano. 


3 1 
EJEMPLO í Sea W = Gen {x;, x2}, donde xı = | 6 | y x2 = | 2 |. Construya una 
0 2 


base ortogonal ([v;¡, v2) para W. 


SOLUCIÓN En la figura 1 se ilustra el subespacio W, junto con x;, x> y la proyección p de 
X2 Sobre x¡. La componente de x, ortogonal a x; es Xx — p, que está en W porque se forma a 
partir de x, y de un múltiplo de x;. Sea vı = x; y 


X2° X] l 15 
X; = == 
X1*X1 ! 2 45 0 


3 





0 

V=X-—p=Xx-— = 0 

2 
Entonces ([v¡, v2) es un conjunto ortogonal de vectores distintos de cero en W. Como 
dim W = 2, entonces el conjunto [v;, vz) es una base para W. E 


El siguiente ejemplo ilustra plenamente el proceso de Gram-Schmidt. Estúdielo con 
cuidado. 


y x= . Entonces, (X1, X2, X3) es, 


1 
EJEMPLO 2 Sean xı = ' e 
1 


Rao 
=.. oOo 


a todas luces, linealmente independiente y, por consiguiente, es una base para un subespacio 
W de R*. Construya una base ortogonal para W. 


SOLUCIÓN 
Paso 1. Sean vı = x; y Wı = Gen {xı} = Gen {v1}. 
Paso 2. Sea va el vector producido al restar de x2 su proyección sobre el subespacio W;. Es 


decir, sea 


V2 = X2 — proyw, X2 





X2° V1 
=X, — vi Ya que vı = X1 
Vi.’ Vi 
0 1 —3/4 
a 1 3 1 z 1/4 
1 41l 1/4 
1 1 1/4 


Como en el ejemplo 1, vz es la componente de x, ortogonal a x4, y {V1, V2} es una base orto- 
gonal para el subespacio W, generado por X; y X2. 


Paso 2' (opcional). Si es pertinente, escale vz para simplificar cálculos posteriores. Como v2 
tiene entradas fraccionales, entonces es conveniente escalarlo por un factor de 4 y sustituir 
{v1, V2} por la base ortogonal 


vV = 


Rh a no 
< 
n= 
Il 
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Paso 3. Sea v3 el vector obtenido restando de x3 su proyección sobre el subespacio W). Utilice 
la base ortogonal (v;, v2) para calcular esta proyección sobre W.: 


Proyección Proyección de 
de x3 sobre vı X3 sobre vs 








l y 1 3 0 
X3 "Vi X3* v2 211 2 1 2/3 
= + t =L = == 
Proy w, X3 Y vi v-v; v2 al 1 E 2 1 2/3 
1 1 2/3 
Entonces, v3 es la componente de x3 ortogonal a W,, a saber, 
0 0 0 

0 2/3 2/3 

V3 — X3 — PIOY y, X3 = 1 2/3 = 1/3 

1 2/3 1/3 


Véase en la figura 2 un diagrama de esta construcción. Observe que v3 está en W porque x3 
y Proyw,X3 están en W. Así, [v;, v2, v3) es un conjunto ortogonal de vectores diferentes de 
cero y, por lo tanto, un conjunto linealmente independiente en W. Observe que W es tridi- 
mensional porque está definido con una base de tres vectores. Por lo tanto, de acuerdo con 
el teorema de la base de la sección 4.5, [v1, v2, v3) es una base ortogonal para W. E 


b PrOYw X3 





1 
W, = Gen(v;, va) 


FIGURA 2 Construcción de v3 a partir de x3 
y W2. 


La demostración del siguiente teorema revela que esta estrategia realmente funciona. 
No se menciona el escalamiento de vectores porque solo se usa para simplificar los cálculos 
a mano. 


TEOREMA 11 Proceso de Gram-Schmidt 
A partir de una base {X1,..., Xp} para un subespacio W de R”, se define 














AT 
x2*V1 
LA vi 
MIV 
X3 ° V1 X3"* Va 
VE NAi: Vila V2 
Vi’ Vi Yo: Y 
Xp’ Vi Xp," V2 Xp" Vp-1 
A A 
Vi’ Vi VoVo Vp -1 ' Vp -1 


Entonces, {v1,..., Vp} es una base ortogonal para W. Además, 


Gen ([vi,..., Vx) = Gen [Xj,..., Xx) paral =k=p (1) 
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DEMOSTRACIÓN Para 1 < k = p, sea W, = Gen [xj,..., Xx). Establezca que vi = X1, 
por lo que Gen {vı} = Gen (x1). Suponga que, para alguna k < p, se construyeron v;j,..., Vx, 
de manera que (v;,..., Vx) es una base ortogonal para W;. Se define 


Vk+1 = Xk+1 — pPrOywk Xk+1 (2) 


De acuerdo con el teorema de descomposición ortogonal, v+; es ortogonal a Wg. Observe 
que proyy, Xx+1 está en W; y, por lo tanto, también en Wg+1. Como Xg+1 está en Wi+1, 
entonces también vz+1 lo está (ya que W;z+1 es un subespacio y es cerrado bajo la resta). 
Además, Vx+1 + 0 porque xz+1 no está en W, = Gen ([Xx1,..., Xx). Por lo tanto, ([v;,..., Vx+1) 
es un conjunto ortogonal de vectores distintos de cero en el espacio (k+1)-dimensional 
Wi+1. De acuerdo con el teorema de la base de la sección 4.5, este conjunto es una base 
ortogonal para W;z+1. Por lo tanto, W¿+1 = Gen fvj,..., Vx+1). El proceso se detiene cuando 
k+1=p. E 


El teorema 11 indica que cualquier subespacio W distinto de cero de R” tiene una base 
ortogonal, porque una base ordinaria {X1,..., Xp} siempre está disponible (de acuerdo con el 
teorema 11 de la sección 4.5), y el proceso de Gram-Schmidt solo depende de la existencia de 
proyecciones ortogonales sobre subespacios de W que ya tengan bases ortogonales. 


Bases ortonormales 


Una base ortonormal se construye con facilidad a partir de una base ortogonal {v1,..., Vp}: 
simplemente se normalizan (es decir, se “escalan”) todas las v¿. Cuando se trabajan proble- 
mas a mano, esto es más fácil que normalizar cada vz conforme se vayan encontrando (porque 
evita la escritura innecesaria de raíces cuadradas). 


EJEMPLO 3 En el ejemplo 1 se construyó la base ortogonal 


3 0 
vı = 6 : V = 0 
0 2 
Una base ortonormal es 
l 13 1/45 
u = —v41=>—|6|l=|2/45 
mp7 Yale f 
1 0 
uU? = ——— V = 0 
[val i 
E 


Factorización QR de matrices 


Si una matriz A de m x n tiene columnas linealmente independientes Xj,..., Xy», la aplica- 
ción del proceso de Gram-Schmidt (con normalizaciones) a Xj,..., X, equivale a factorizar 
A, como se describe en el siguiente teorema. Esta factorización se utiliza ampliamente en 
algoritmos computacionales para diversos cálculos, como la resolución de ecuaciones (que 
se analizó en la sección 6.5) y la determinación de valores propios (que se mencionó en los 
ejercicios de la sección 5.2). 


TEOREMA 12 
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La factorización QR 


Si A es una matriz de m x n con columnas linealmente independientes, entonces A se 
puede factorizar como A = OR, donde O es una matriz de m x n cuyas columnas for- 
man una base ortonormal para Col A, y R es una matriz triangular superior invertible 
de n x n con entradas positivas en su diagonal. 


DEMOSTRACIÓN Las columnas de A forman una base (X;,..., X,) para Col A. Construya 
una base ortonormal (u;,..., u,) para W = Col A con la propiedad (1) del teorema 11. Esta 
base se puede construir mediante el proceso de Gram-Schmidt o con alguna otra técnica. 
Sea 


O=[u u © u] 
Para k = 1,..., n, xx está en Gen [Xxj,..., Xx) = Gen {u;,..., Ug}. Entonces existen constantes, 
Y1k»..., Fx tales que 
Xk = riku Hee + YT£kU0g + 0-01 +++ + 0-0, 
Podemos suponer que rg = 0. (Si rix < 0, multiplique ri y U¿ por —1). Esto muestra que Xz 


es una combinación lineal de las columnas de O empleando como pesos las entradas del 
vector 


Fik 
ry = | "kk 
0 
Es decir, xų = Or; para k = 1,...,n. Sea R = [r; -** r,]. Entonces, 
A=[x1 ++: x»]=[Ori +: Qr,]=0R 


El hecho de que R es invertible se deduce fácilmente del hecho de que las columnas de A son 
linealmente independientes (ejercicio 19). Como resulta evidente que R es triangular superior, 
sus entradas diagonales no negativas deben ser positivas. El 


1.0.0 
o 1 1 0 
EJEMPLO 4 Encuentre una factorización OR de A = I l 1 
1 1 1 


SOLUCIÓN Las columnas de A son los vectores Xy, X2 y X3 del ejemplo 2. En ese ejemplo, 
se encontró una base ortogonal para Col A = Gen {X}, X2, X3}: 


1 3 0 

1 , 1 —2/3 
ls A e A a 

1 1 1/3 


Para simplificar la aritmética que sigue, escale v3 dejando que v3 = 3v3. Después, normalice 
los tres vectores para obtener u;, u> y uz, y utilice esos vectores como las columnas de O: 


A AT 0 

1/2 1/0 2/46 
g= 1/2 YD. 1/46 

1/2 1/4 1/46 
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Por construcción, las primeras k columnas de O son una base ortonormal de Gen ([Xj,..., Xx). 
De la demostración del teorema 12, A = OR para alguna R. Para encontrar R, observe que 
QTQ = [, porque las columnas de O son ortonormales. De ahí que 


QA = O (QR) = IR =R 


1/2 1/2 1/2 1/2 
R=|-3V2 1/42 1/42 1/42 
0 2/46 1/46 1/46 


O ai 
ha ao 
Rh oo 


2 3/2 1 
=|0 3/7/12 2/12 E 
0 0 2/46 


NOTAS NUMÉRICAS 





1. Cuando el proceso de Gram-Schmidt se ejecuta en una computadora, el error por 
redondeo puede crecer conforme se van calculando los vectores ug, uno por uno. 
Cuando j y k son grandes, pero diferentes, los productos interiores uu quizá no 
sean suficientemente cercanos a cero. Esta pérdida de ortogonalidad se puede re- 
ducir de manera sustancial reordenando los cálculos.! Sin embargo, en vez de este 
método de Gram-Schmidt modificado se prefiere el método de la factorización QR 
basado en computadora porque conduce a bases ortonormales más exactas, aun 
cuando la factorización requiere casi el doble de aritmética. 


. Para obtener una factorización QR de una matriz A, un programa de cómputo ge- 
neralmente multiplica A por la izquierda por una secuencia de matrices ortogonales 
hasta que A se transforme en una matriz triangular superior. Esta construcción es 
análoga a la multiplicación por la izquierda con matrices elementales que produce 
una factorización LU de A. 


PROBLEMA DE PRÁCTICA 


1 1/3 
Sea W = Gen {Xx;, X2}, donde x; = | 1 | Yy X2 = 1/3 |. Construya una base ortonormal 
—2/3 


para W. 


6.4 EJERCICIOS 


En los ejercicios 1 a 6, el conjunto indicado es una base para un sub- 2 4 
espacio W. Utilice el proceso de Gram-Schmidt con la finalidad de 3 i 
obtener una base ortogonal para W. 


e EA a E AS 


2 7 


l Véase Fundamentals of Matrix Computations, de David S. Watkins (Nueva York: John Wiley £ Sons, 1991), 
pp. 167-180. 


Encuentre una base ortonormal del subespacio generado por 
los vectores del ejercicio 3. 


Obtenga una base ortonormal del subespacio generado por los 
vectores del ejercicio 4. 


En los ejercicios 9 a 12, determine una base ortogonal para el espacio 
columna de cada matriz. 


11. 


3 5 3 -1 6 5 
A SA 3-8 3 
-1 5 -2 2 -2 6 
3 -7 8 1 —4 -3 
1 2 5 1 3 5 
-1 1 -4 -1 -3 1 
1 4 -3| 12. | 0 2 3| 
114 7 1 5 2 
1 2 1 1 5 8 


En los ejercicios 13 y 14, las columnas de Q se obtuvieron aplicando 
el proceso de Gram-Schmidt a las columnas de A. Encuentre una ma- 
triz R triangular superior tal que A = QR. Compruebe su resultado. 


5 9 5/6 —1/6 

1 7 | 1/6 5/6 

3 -5 p2 =] -3/6 1/6 

1 $ 1/6 3/6 

-2 3 -2/7 5/7 
E o| 5/7 I 

=| 2 2 |pL=]| 2/7 -4/7 
4 el 4/7 A 


15. Encuentre una factorización QR de la matriz del ejercicio 11. 


16. Obtenga una factorización QR de la matriz del ejercicio 12. 


En los ejercicios 17 y 18, todos los vectores y subespacios están en 
R”. Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. 


17. a) Si [v;, va, v3) es una base ortogonal para W, entonces la 


18. 


b) 


c) 


b) 


c) 


multiplicación de v3 por un escalar c da una nueva base orto- 
gonal (v;, va, cv3). 

El proceso de Gram-Schmidt aplicado a un conjunto lineal- 
mente independiente (X;,..., Xp) produce un conjunto orto- 
gonal (v;,..., vp) con la propiedad de que para cada k, los 
vectores vj,..., V¿ generan el mismo subespacio que se origi- 
NÓ por X1,..., Xk. 


Si A = OR, donde O tiene columnas ortonormales, entonces 
R = Q'A. 


Si W = Gen [(x1, X2, X3} con {X1, X2, X3} linealmente inde- 
pendiente, y si {V1, V2, V3} es un conjunto ortogonal en W, 
entonces {V1, V2, V3} es una base para W. 


Si x no está en un subespacio W, entonces x — proyw X no 
es cero. 


En una factorización QR, por ejemplo, A = QR (cuando 
A tiene columnas linealmente independientes), las colum- 
nas de Q forman una base ortonormal para el espacio co- 
lumna de A. 


19. 
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Suponga que A = QR, donde Q es de m x n y R es de n x n. 
Demuestre que si las columnas de A son linealmente indepen- 
dientes, entonces R debe ser invertible. [Sugerencia: Estudie la 
ecuación Rx = 0 y considere el hecho de que A = QR]. 


20. Suponga que A = OR, donde R es una matriz invertible. 


21. 


22. 


23. 


24. 


25. 


26. 


Demuestre que A y Q tienen el mismo espacio columna. 
[Sugerencia: Dada y en Col A, demuestre que y = Ox para 
alguna x. Además, dada y en Col Q, demuestre que y = Ax 
para alguna x]. 


Dada A = QR como en el teorema 12, describa cómo encontrar 
una matriz ortogonal Q; de m x m y una matriz triangular su- 
perior invertible R de n x n tales que 


s-o] 


La instrucción qr de MATLAB proporciona esta factorización 
QR “completa” cuando el rango de A = n. 


Sean u;,..., u, una base ortogonal para un subespacio W de R”, 
y T: R” — R” definida por T(x) = proyw x. Demuestre que T 
es una transformación lineal. 


Suponga que A = OR es una factorización QR de una matriz A 
de m x n (con columnas linealmente independientes). Particio- 
ne A como [4; A], donde A; tiene p columnas. Muestre cómo 
obtener una factorización QR de Ay, y explique por qué su fac- 
torización tiene las características adecuadas. 


[M] Utilice el proceso de Gram-Schmidt, como en el ejemplo 2, 
y obtenga una base ortogonal para el espacio columna de 


—10 13 7 —11 

2 LL. .=3 3 

A= —6 3 13  -3 
16 —16 -2 5 

2 LS 4 


[M] Aplique el método expuesto en esta sección para obtener 
una factorización de la matriz del ejercicio 24. 


[M] En un programa de matrices, el proceso de Gram-Schmidt 
funciona mucho mejor con vectores ortonormales. Comenzan- 
do con X;,..., Xy como en el teorema 11, sea A = [xı + xp]. 
Suponga que O es una matriz de n x k cuyas columnas forman 
una base ortonormal para el subespacio Wp generado por las 
primeras k columnas de A. Entonces para x en R”, QQ"x es la 
proyección ortogonal de x sobre W, (teorema 10 de la sección 
6.3). Si xy +1 es la siguiente columna de A, entonces la ecuación 
(2) en la demostración del teorema 11 se convierte en 


Ve+1= X41— O(0*x141) 


(Los paréntesis en la ecuación anterior reducen el número de 
operaciones aritméticas). Sea Ux+1 = Vx+1/U1Vx*+1|]. La nueva 
O para el siguiente pasoes [O  u;z+:1]. Utilice este procedimien- 
to para calcular la factorización QR de la matriz del ejercicio 24. 
Escriba las instrucciones que utilice. 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


X2° V1 





Sean v; =x, = | 1 | y w =X — vı = X — 0v; = X2. Así, {X;, X2} ya es orto- 


Vi. Vi 


gonal. Ahora todo lo que se necesita es normalizar los vectores. Sea 


1 i 1/43 
ism el = ee 


En vez de normalizar v, directamente, se normaliza v3 = 3v2: 


: f 1 1/46 
A a 
2 12+ 1 + (22) 9 20546 


Entonces, {u;, u2} es una base ortonormal para W. 





u2 


6.5 PROBLEMAS DE MÍNIMOS CUADRADOS 


El ejemplo introductorio a este capítulo describió un enorme problema del tipo Ax = b que 
no tuvo solución. En las aplicaciones son frecuentes los sistemas inconsistentes, aunque por 
lo general no aparecen matrices de coeficientes tan grandes. Cuando se pide una solución y 
esta no existe, lo mejor que se puede hacer es encontrar una x tal que Ax esté lo más cerca 
posible de b. 

Piense que Ax es una aproximación a b. Cuanto menor sea la distancia entre b y Ax, 
dada por lb — Axl|, mucho mejor será la aproximación. El problema general de mínimos 
cuadrados consiste en encontrar una x que haga a [|b — Ax]| tan pequeña como sea posible. 
El adjetivo “mínimos cuadrados” se origina en el hecho de que lb — Axl| es la raíz cuadrada 
de una suma de cuadrados. 





DEFINICIÓN Si A es dem x n y b está en R”, una solución de mínimos cuadrados de Ax = b es 
un ĝen R” tal que 


Ilb — AX|| = [b — Axl 


para toda x en R”. 


El aspecto más importante del problema de mínimos cuadrados es que sin importar cuál 
x se seleccione, el vector Ax necesariamente estará en el espacio columna, Col A. Así que 
se busca un vector x que haga que Ax sea el punto en Col A más cercano a b. Véase la figura 
1. (Desde luego, si b resulta estar en Col A, entonces b es Ax para alguna x, y tal x es una 
“solución de mínimos cuadrados”). 





Col A “Ax 


FIGURA 1 El vector b está más cerca de AX 
que de Ax para otra x. 
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Solución del problema general de mínimos cuadrados 


Con base en los A y b anteriores, aplique el teorema de la mejor aproximación que se expuso 
en la sección 6.3 al subespacio Col A. Sea 


D = PrOYCOol A b 


Como b está en el espacio columna de A, la ecuación Ax = bes consistente, y existe una b 
en R” tal que 


AR=6b (1) 


Como bes el punto en Col A más cercano a b, un vector X es una solución de mínimos cua- 
drados de Ax = b si y solo si X satisface la ecuación (1). Tal Xen R” es un lista de pesos para 
construir ba partir de las columnas de A. Véase la figura 2. [Existen muchas soluciones de 
la ecuación (1) si tiene variables libres]. 


b- AX ob 
AS 
0 x 
Col A subespacio de R” 
> A 


R” 


FIGURA 2 La solución de mínimos cuadrados X está en R”. 


Suponga que X satisface AX = b. Según el teorema de descomposición ortogonal de la 
sección 6.3, la proyección Ô tiene la propiedad de que b — bes ortogonal a Col A, de manera 
que b — AX es ortogonal a cada columna de A. Si a, es cualquier columna de A, entonces 
aj"(b— AX) =0 y a (b — AX) = 0. Como cada a es una fila de A”, 


AT (b— A) =0 (2) 
(Esta ecuación también se deduce del teorema 3 de la sección 6.1). Así, 
ATb — ATAR = 0 
ATAR = ATb 


Estos cálculos indican que cada solución de mínimos cuadrados de Ax = b satisface la 
ecuación 


ATAx = A'b (3) 


La ecuación matricial (3) representa un sistema de ecuaciones llamado las ecuaciones nor- 
males para Ax = b. Es frecuente que cada solución del sistema (3) se denote con Ê. 


El conjunto de soluciones de mínimos cuadrados de Ax = b coincide con el conjunto 
no vacío de soluciones de las ecuaciones normales A7Ax = A7b. 


DEMOSTRACIÓN Como ya se mostró antes, el conjunto de soluciones de mínimos cuadra- 
dos es no vacío y cada solución de mínimos cuadrados X satisface las ecuaciones normales. 
A la inversa, suponga que X satisface A7AX = A”b. Entonces, X satisface la ecuación (2) an- 
terior, lo que demuestra que b — AXes ortogonal a las filas de 47 y, por lo tanto, ortogonal 
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a las columnas de A. Como las columnas de A generan Col A, entonces el vector b — AX 
es ortogonal a todo elemento de Col A. Por consiguiente, la ecuación 
b= AX + (b— AX) 


es una descomposición de b en la suma de un vector en Col A y de un vector ortogonal a 
Col A. Por la singularidad de la descomposición ortogonal, AX debe ser la proyección orto- 
gonal de b sobre Col A. Es decir, AX = b, y X es una solución de mínimos cuadrados. E 


EJEMPLO 1 Encuentre una solución de mínimos cuadrados del sistema inconsistente 


Ax = b para 
4 0 2 
A=|0 2|, b=]| 0 
1 1 11 


SOLUCIÓN Para emplear las ecuaciones normales (3), calcule 


4 0 
mn f4 0 A [17 1 
a= 2 1] pl = |” J 
1 1 
2 
m f4 o0 ı [19 
ao=[5 2 1] n = [55] 


Entonces, la ecuación A7Ax = ATb se convierte en 


17 1x1] _ [19 
1 5 X2 a 11 
Pueden utilizarse operaciones de fila para resolver este sistema, pero como A7A es de 2 x 2 
e invertible, tal vez sea más rápido calcular 


1 5 —1 
Tjay ia E 
C ala ña 
y luego resolver A7Ax = A7b como 
£ = (4%) 47b 


= 4 mL, = ls] =| 2. . 


En muchos cálculos, ATA es invertible, pero este no siempre es el caso. El siguiente 
ejemplo implica a una matriz como las que suelen presentarse en estadística, en problemas de 
análisis de varianza. 


EJEMPLO 2 Encuentre una solución de mínimos cuadrados de Ax = b para 


1 1 0 0 -3 
1 1 0 0 zj 
1 0 1 0 0 
AS ra PA a 
1 0 0 1 5 
1 0 0 1 1 


TEOREMA 14 
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SOLUCIÓN Calcule 


1.1.0.0 
1 1 1 1 1 1 1 1 0 0 6i Zu 2e 2 
ATA = 1 1 0 0 0Ọ0 0 1 0 1 0| |2 2 0-0 
0 0 1 1 0.0 1.0 1 0| [2 0 2 Ọ 
0o 0 0 O 1 1 1 0 O0 1 2 0 0 2 
1 0 O0 1 
—3 
1 1 1 1 1 1 -1 4 
Tn |1 1 0 0 0.0 0|_|-4 
aa 0.0 1.1.0.0 2 2 
0.0 0 0 1. 1 5 6 
1 
La matriz aumentada para AZAx = A7b es 
6 2 2 2 4 1 0 0 1 3 
2 2 0 0 —4 0 1 0 -1 —5 
2.002 0 2 0 0 1-1 -2 
2 0 0 2 6 0.0. 0 0. 0 
La solución general es xı = 3 — x4, X2 = —5 + x4, X3 = —2 + x4, y x4 es libre. Así, la so- 
lución general de mínimos cuadrados de Ax = b tiene la forma 
3 —1 
5 —5 1 
X = 3 + x4 1 E 
0 1 


El siguiente teorema brinda útiles criterios para determinar cuándo existe solamente una 
solución de mínimos cuadrados de Ax = b. (Desde luego, la proyección ortogonal b siempre 
es única). 


Sea A una matriz de m x n. Los siguientes enunciados son lógicamente equivalentes: 


a) La ecuación Ax = b tiene una solución de mínimos cuadrados única para cada b 
en R”. 


b) Las columnas de A son linealmente independientes. 


c) La matriz ATA es invertible. 


Cuando estos enunciados son verdaderos, la solución de mínimos cuadrados está 
dada por 


ĝ = (ATA) ! ATb (4) 


En los ejercicios 19 a 21 se indican los elementos principales para demostrar el teore- 
ma 14; en tales ejercicios también se revisan conceptos del capítulo 4. La fórmula (4) para X 
es útil sobre todo para fines teóricos y cálculos a mano cuando A7A es una matriz invertible 
de 2 x 2. 

Cuando se usa una solución X de mínimos cuadrados para producir AX como una apro- 
ximación a b, entonces la distancia de b a AX se llama el error de mínimos cuadrados de 
esta aproximación. 


EJEMPLO 3 Dados A y b como en el ejemplo 1, determine el error de mínimos cuadra- 
dos en la solución de mínimos cuadrados de Ax = b. 
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FIGURA 3 





SOLUCIÓN A partir del ejemplo 1, 


2 4 0 1 4 
b = 0 y Aĝ=]|0 2 [>| =|4 
11 1 1 3 
Por lo tanto, 
2 4 —2 
11 3 8 


Ib— 43 = vV (—2)} + (4)? + 82 = V84 


El error de mínimos cuadrados es v84. Para cualquier x en R?, la distancia entre b y el vector 
Ax es al menos y~ 84. Véase la figura 3. Observe que la solución de mínimos cuadrados no 
se presenta en la figura. E 


Cálculos alternativos de soluciones de mínimos cuadrados 


El siguiente ejemplo muestra cómo encontrar una solución de mínimos cuadrados de Ax = b 
cuando las columnas de A son ortogonales. Con frecuencia tales matrices se presentan en 
problemas de regresión lineal, como los que se analizarán en la siguiente sección. 


EJEMPLO 4 Encuentre una solución de mínimos cuadrados de Ax = b para 


1 —6 zj 
1 —2 2 
A=|i ip Þ5]| i 
1 7 6 


SOLUCIÓN Como las columnas a; y a» de A son ortogonales, la proyección ortogonal de b 
sobre Col A está dada por 


b-a b-a2 8 45 





D = = 
aj’ a at a° a 4” BS 907 
2 —3 —1 
A Eea a 
=]i2 1/2 |7 | 5/2 
2 7/2 11/2 (5) 


Ahora que se conoce D, se puede resolver AX = D. Pero esto es trivial, porque ya se sabe 
que los pesos a colocar sobre las columnas de A producen b. A partir de la ecuación (5) es 


claro que 
> _ | 8⁄4 |_| 2 
2=| 4290] = | 172] A 


En algunos casos, es posible que las ecuaciones normales para un problema de mínimos 
cuadrados estén mal condicionadas; es decir, en ocasiones, pequeños errores en los cálculos 
de las entradas de ATA causan grandes errores en la solución X. Si las columnas de A son 
linealmente independientes, la solución de mínimos cuadrados con frecuencia se puede calcu- 
lar de manera más confiable con una factorización QR de A (descrita en la sección 6.4).' 


1 El método QR se compara con el método de la ecuación normal estándar en G. Golub y C. Van Loan, Matrix 
Computations, 3a. ed. (Baltimore: Johns Hopkins Press, 1996), pp. 230-231. 
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Dada una matriz A de m x n, con columnas linealmente independientes, sea A = OR 
una factorización QR de A como en el teorema 12. Entonces, para cada b en R”, la 
ecuación Ax = b tiene una solución de mínimos cuadrados única, dada por 


2=R! Qb (6) 


DEMOSTRACIÓN Sea X = R”! Q7b. Entonces, 


AR = QR = QRR! Qb = Q Q7b 


De acuerdo con el teorema 12, las columnas de Q forman una base ortonormal para Col A. 
Por lo tanto, según el teorema 10, QOTb es la proyección ortogonal D de b sobre Col A. Así, 
AX = b, lo que muestra que X es una solución de mínimos cuadrados de Ax = b. La unicidad 
de X se deduce del teorema 14. E 


NOTA NUMÉRICA 


Como en el teorema 15, R es triangular superior, entonces X se debería calcular como 
la solución exacta de la ecuación 


Rx = Q7b (7) 


Es mucho más rápido resolver (7), por sustitución hacia atrás o mediante operaciones 
de fila, que calcular R”! y utilizar la ecuación (6). 


EJEMPLO 5 Encuentre la solución de mínimos cuadrados de Ax = b para 


1 
1 
a 
1 


Uh Hu 


SOLUCIÓN La factorización QR de A se obtiene como en la sección 6.4 


1/2 1/2 1/2 


2 de 18 
e _ | 1/2 -1/2 -1/2 
Am OR SEa 000 i , : 
1/2 1/2 —1/2 
Luego, 
3 
1/12 1/2 1/2 1/2 5 6 
OTb=| 1/2 -1/2 -1/2 1/2 is 
1/2 -1/2 1/2 -1/2 3 4 
La solución de mínimos cuadrados Ê satisface Rx = Qb; es decir, 
2 4 5 X1 6 
0 2 3 x|=]|-6 
0 0 2 X3 4 
10 
Esta ecuación se resuelve fácilmente y conduce a x= | —6 |. E 


2 


366 CAPÍTULO 6 Ortogonalidad y mínimos cuadrados 


PROBLEMAS DE PRÁCTICA 


I 53 =3 


1. Sen A4=|1 5 
1 7 


5 
y b = | —3 |. Encuentre una solución de mínimos cuadra- 
=5 


dos de Ax = b, y calcule el error de mínimos cuadrados asociado. 


2. ¿Qué se puede decir acerca de la solución de mínimos cuadrados de Ax = b cuando b es 
ortogonal a las columnas de A? 


6.5 EJERCICIOS 


En los ejercicios 1 a 4, encuentre una solución de mínimos cuadrados 
de Ax = b mediante a) la construcción de las ecuaciones normales 
para Å y b) el despeje de X. 

-1 2 


An 
J 
j: 


En los ejercicios 5 y 6, describa todas las soluciones de mínimos 
cuadrados de la ecuación Ax = b. 


1 1 0 1 
1 1 0 3 
5 A4=|i o 1bÞ=l} 
1 0 1 2 
1 1 0 7 
1 1 0 2 

oļi 1 o | E 3 | 
6 a=] o 1bÞ=l5 
1 0 1 5 
1 0 1 4 


7. Calcule el error de mínimos cuadrados asociado con la solución 
de mínimos cuadrados que encontró en el ejercicio 3. 


8. Determine el error de mínimos cuadrados asociado con la solu- 
ción de mínimos cuadrados que encontró en el ejercicio 4. 


En los ejercicios 9 a 12, encuentre a) la proyección ortogonal de b 
sobre Col A y b) una solución de mínimos cuadrados de Ax = b. 


1 4 
9% A=| 3 1|b=|-2 
-2 4 8 





[1 2 3 
10. A= | —1 4 |,b= | —1 
[| 1 2 5 
4 0 a 9 
1 -5 1 0 
1. 4A= 6 1 apo 0 
[1 -1 -5 0 
Po 1 1 J a 
1 0 —1 5 
12. A= 0 1 aa 
| -1 1 —1 6 
3 4 11 
13. Sean A = | —2 1 |, b= | —9 =f i] yv = 
3 4 5 


5 
15d Calcule Au y Av, y compárelos con b. ¿Podría ser u 


una solución de mínimos cuadrados de Ax = b? (Responda sin 
calcular una solución de mínimos cuadrados). 


2 1 5 4 
14. Sean A= | -3 —4 |, b=]ļ|4 aek y v 
3 2 4 


6 : ; 
Es | Determine Au y Av, y compárelos con b. ¿Es posible 


que al menos uno de los dos entre u o v sea una solución de 
mínimos cuadrados de Ax = b? (Responda sin obtener una 
solución de mínimos cuadrados). 


En los ejercicios 15 y 16, utilice la factorización A = OR para encon- 
trar la solución de mínimos cuadrados de Ax = b. 


3.3 2/3 —1/3]r3 5 7 

15. A=|2 4|=|2/3 2/3 k [>= 3 
1 1l 1/3 -2/3 1 

1 1 1/2 —1/2 zi 

AN AA: Ts 3], | 6&6 

16 A=| i a |=] 1/2 -1/2 F ¿)0- 5 
1 4 1/2 1/2 7 


En los ejercicios 17 y 18, A es una matriz de m x n y b está en R”. 
Marque cada enunciado como verdadero o falso. Justifique sus res- 
puestas. 


17. a) El problema de mínimos cuadrados general consiste en obtener 
una x que haga que Ax esté tan cerca de b como sea posible. 


18. 


19. 


20. 


21. 


22. 


23. 


b) Una solución de mínimos cuadrados de Ax = b es un vector 
X que satisface AX = b, donde b es la proyección ortogonal 
de b sobre Col A. 


c) Una solución de mínimos cuadrados de Ax = b es un vector 
£ tal que lb — Axl] < lb — AX] para toda x en R”. 
Cualquier solución de A7Ax = ATb es una solución de míni- 
mos cuadrados de Ax = b. 


d 


o 


e) Si las columnas de A son linealmente independientes, enton- 
ces la ecuación Ax = b tiene exactamente una solución de 
mínimos cuadrados. 


a) Si b está en el espacio columna de A, entonces cada solución 
de Ax = b es una solución de mínimos cuadrados. 


b) La solución de mínimos cuadrados de Ax =b es el punto en 
el espacio columna de A más cercano a b. 


c) Una solución de mínimos cuadrados de Ax = b es una lista 
de pesos que, cuando se aplica a las columnas de A, produce 
la proyección ortogonal de b sobre Col A. 


d) Si X es una solución de mínimos cuadrados de Ax = b, 
entonces £ = (ATA)! ATb. 

e) Las ecuaciones normales siempre ofrecen un método confia- 
ble para calcular soluciones de mínimos cuadrados. 

f) Si A tiene una factorización QR, por ejemplo, A = QR, en- 
tonces la mejor manera de obtener una solución de mínimos 
cuadrados de Ax = b es calcular = R7! QTb. 


Sea A una matriz de m x n. Realice los siguientes pasos para 
demostrar que un vector x en R” satisface Ax = 0 si y solo si 
ATAx = 0. Esto demostrará que Nul A = Nul 47A. 


a) Demuestre que si Ax = 0), entonces A7Ax = 0. 
b) Suponga que ATAx = 0. Explique por qué x7A7Ax = 0, y 
use esto para probar que Ax = 0. 


Sea A una matriz de m x n tal que A7A es invertible. Demuestre 
que las columnas de A son linealmente independientes. [Pre- 
caución: No suponga que A sea invertible; es más, tal vez ni 
siquiera sea cuadrada]. 


Sea A una matriz de m x n cuyas columnas son linealmente in- 

dependientes. [Precaución: A no necesariamente es cuadrada]. 

a) Con base en el ejercicio 19, demuestre que ATA es una matriz 
invertible. 


b) Explique por qué A debe tener, al menos, tantas filas como 
columnas. 


c) Determine el rango de A. 


Con base en el ejercicio 19, demuestre que rango ATA = ran- 
go A. [Sugerencia: ¿Cuántas columnas tiene ATA? ¿Cómo se 
relaciona esto con el rango de ATA?]. 


Suponga que A es de m x n con columnas linealmente indepen- 
dientes y que b está en R”. Utilice las ecuaciones normales con 
la finalidad de obtener una fórmula para D, la proyección de b 
sobre Col A. [Sugerencia: Primero encuentre X. La fórmula no 
requiere una base ortogonal para Col A]. 


24. 


25. 


26. 
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Obtenga una fórmula para la solución de mínimos cuadrados de 
Ax = b cuando las columnas de A son ortonormales. 


Describa todas las soluciones de mínimos cuadrados del 
sistema 


x+y=2 
x+y=4 


[M] El ejemplo 3 de la sección 4.8 mostró un filtro lineal pasa 
bajos que cambió la señal (y) en [yx+1) y transformó la señal 
de alta frecuencia (wz) a una señal cero, donde yg = cos(11k/4) 
y w; = cos(31rk/4). Los siguientes cálculos diseñarán un filtro 
con aproximadamente esas propiedades. La ecuación del fil- 
tro es 


aoYk+2 + 41Yk+1 + 42YyYk = Zk para toda k (8) 


Como las señales son periódicas, con periodo 8, basta con estu- 
diar la ecuación (8) para k = 0,...,7. La acción sobre las dos se- 
ñales descritas se traduce en dos conjuntos de ocho ecuaciones, 
que se muestran a continuación: 








Yk42 Yk+1 Yk Yk+1 
k=0 0 T 1 Y 
k=1 | -.7 0 a | 0 
-1 -7 0| n —.7 
-7 -1 -7 _]| -1 
Al - FeaT 
7 0  -7 2 0 
1 1 0 q 
k= 7 1 .7 1 
Wk+2 Wk+ı Wk 
k=0 0 —.7 1 0 
k=.1 li 0 a o| 
e a ll 
dı = 
0 7 =l | : 0 | 
—.7 0 EE 0 | 
1 —.7 0 0 
k=7 —.7 1 —.7 0 


Escriba una ecuación Ax = b, donde A es una matriz de 16 x 3 
formada por las dos matrices de coeficientes anteriores y don- 
de b en R!' se forma a partir de los dos lados derechos de las 
ecuaciones. Encuentre ap, a; y az dadas por la solución de mí- 
nimos cuadrados de Ax = b. (El .7 en los datos anteriores se 
empleó como una aproximación a V2/2, para ilustrar cómo 
se procede en un cálculo típico en un problema aplicado. Si, en 
vez de ello, se utilizara .707, los coeficientes del filtro resultan- 
te concordarían, al menos, en siete decimales con 2/4, 1/2 
y 2/4, los valores obtenidos mediante cálculos aritméticos 
exactos). 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Primero calcule 


on ATTE 33 3 9 Ọ 

AA=|-3 5 7||1 5 1|=|9 8 28 
ss E AN T 2 0 28 14 
l1 1 1 5 -3 

Ab=|-3 5 7||-3|=|-65 
-3 1 2||=5 —28 


Después, reduzca por filas la matriz aumentada para las ecuaciones normales ATAx = Afb: 


3 9 0 —3 1 3 0 -—1 1 0 —3/2 2 
9 83 28 —65|~ |0 56 28 —56 |~.--~ |0 1 1/2 —1 
0 28 14 —28 0 28 14 -—28 0 0 0 0 
La solución de mínimos cuadrados general es xı = 2 + 3X3, xXx: = —l — Lx3, con x3 


libre. Para una solución específica, tome x3 = 0 (por ejemplo), y obtenga 


1 -3 -3 2 5 
b=Ax=|1 5 1 -=1|=]jf-3 
1 7 2 0 =5 


Resulta que b = b, de manera que [lb — b|| = 0. El error de mínimos cuadrados es cero 
porque b está en Col A. 


2. Si b es ortogonal a las columnas de A, entonces la proyección de b sobre el espacio 
columna de A es 0. En este caso, una solución de mínimos cuadrados X de Ax = b sa- 
tisface AX = 0. 


6.6 | APLICACIONES A MODELOS LINEALES 


Una tarea común en ciencia e ingeniería es analizar y entender relaciones entre diferentes 
cantidades que varían. Esta sección describe una variedad de situaciones en las que los datos 
se emplean para construir o comprobar una fórmula que predice el valor de una variable como 
función de otras variables. En cada caso, el reto será equivalente a resolver un problema de 
mínimos cuadrados. 

Para facilitar la aplicación del análisis a problemas reales que encontrará en sus activi- 
dades profesionales, se elige la notación que comúnmente se utiliza en el análisis estadístico 
de datos científicos y de ingeniería. En vez de escribir Ax = b, se escribe XB = y, donde X 
es la matriz de diseño, f es el vector de parámetros y y es el vector de observaciones. 


Rectas de mínimos cuadrados 


La relación más sencilla entre dos variables x y y es la ecuación lineal y = Bp + Bix.' 
Con frecuencia los datos experimentales generan los puntos (x1, y1),..., (Xn, Yn) que, cuando 


1 Es común utilizar esta notación para rectas de mínimos cuadrados en vez de y = mx + b. 


6.6 Aplicaciones a modelos lineales 369 


se grafican, parecen estar cerca de una recta. Se desea determinar los parámetros Bo y B1 
para hacer que la recta esté lo más “cerca” posible de dichos puntos. 

Suponga que fo y 6; están fijos, y considere la recta y = Bo + fx de la figura 1. Para 
cada dato (x;, yj) existe un punto (x;, Bo + B1x;) sobre la recta con la misma coordenada x. Por 
otro lado, y; es el valor observado de y, y Bo + B1x; es el valor predicho para y (determinado 
por la recta). La diferencia entre los valores observado y predicho para y se llama residuo. 


Punto dato 
a GQ, y) 


@ Bo +B) 


Punto sobre 


la recta Residuo — TeResidio 


y =P + 6x 
| x 


| 
T 
1 *x; Xn 


X 


FIGURA 1 Ajuste de datos experimentales a una recta. 


Existen varias maneras de medir qué tan “cerca” está la recta respecto de los datos. La 
elección habitual (sobre todo porque los cálculos matemáticos son sencillos) es sumar los 
cuadrados de los residuos. La recta de mínimos cuadrados es la recta y = Bo + 61x que mi- 
nimiza la suma de los cuadrados de los residuos. A esta recta también se le conoce como recta 
de regresión de y sobre x, porque se supone que cualquier error en los datos solo ocurre en 
las coordenadas y. Los coeficientes Bo, B1 de la recta son los coeficientes de regresión.? 

Si los puntos de los datos estuvieran sobre una recta, los parámetros Bo y 61 satisfarían 
las ecuaciones 





Valor Valor 
predicho de y observado de y 
Bo+ Bix  = yı 
Bo + bx = Ya 
Bo + BiXn z Yn 





Este sistema se puede representar como 


I. -Xi yı 
1 x Bo »2 
XB=y donde X=|. ol, B= Bill y=| . (1) 
: i 1 ; 
1 Xn Yn 


Desde luego, si los puntos de datos no están sobre una recta, entonces no existen parámetros 
Bo, fB1 para los cuales los valores predichos de y en X£ sean iguales a los valores observados 
de y en y, y XG = y no tiene solución. Este es un problema de mínimos cuadrados, Ax = b, 
icon diferente notación! 

El cuadrado de la distancia entre los vectores Xf y y es precisamente la suma de los 
cuadrados de los residuos. El f£ que minimiza esta suma también minimiza la distancia en- 
tre X y y. Calcular la solución de mínimos cuadrados de XB = y equivale a encontrar el 
vector P que determina la recta de mínimos cuadrados de la figura 1. 


2 Si los errores de medición estuvieran en x y no en y, simplemente se intercambiarían las coordenadas de los datos 
(xj, y¡) antes de trazar la gráfica de los puntos y calcular la recta de regresión. Si ambas coordenadas están sujetas 
a posibles errores, entonces se podría elegir la recta que minimiza la suma de los cuadrados de las distancias orto- 
gonales (perpendiculares) de los puntos a la recta. Véase los problemas de práctica de la sección 7.5. 
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EJEMPLO 1 Encuentre la ecuación y = Bo + fix de la recta de mínimos cuadrados que 
mejor se ajuste a los puntos de datos (2, 1), (5, 2), (7, 3) y (8, 3). 


SOLUCIÓN Utilice las coordenadas x de los datos para construir la matriz de diseño X en la 
ecuación (1) y las coordenadas y para construir el vector de observaciones y: 


Rh a 
O NaN 


1 

o ]2 
da 
3 


Para la solución de mínimos cuadrados de Xf = y, obtenga las ecuaciones normales (con la 
nueva notación): 


Xx Tx p =X?y 
Es decir, calcule 
1 2 
Ty [1 1 1 1 L 5|_]| 4 22 
xx =|> 5 7 8 1 7 22 142 
1 8 
1 
r |1 1 1 1 2|_ | 9 
ryj; 5 s| 3 |Z [57 
3 


Las ecuaciones normales son 


4 22 || &œļ_| 9 
22 142||Bı| |57 
Por lo tanto, 


15 = e T z aa Aa T a30 | = EA 


De manera que la recta de mínimos cuadrados tiene la ecuación 


E 
AO a 


Véase la figura 2. E 


e t ee 
1 23456789 





FIGURA 2 La recta de mínimos 
cuadrados y = Z + Ex. 


Una práctica común, antes de calcular la recta de mínimos cuadrados, consiste en cal- 
cular el promedio x de los valores x originales y formar una nueva variable x* = x — x. Se 
dice que los nuevos datos x quedan en su forma de desviación media. En este caso, las dos 
columnas de la matriz de diseño serán ortogonales. Se simplifica la solución de las ecuacio- 
nes normales, justo como en el ejemplo 4 de la sección 6.5. Véase los ejercicios 17 y 18. 


Costo promedio 
por unidad 





Unidades producidas 


FIGURA 3 
Curva de costo promedio. 


Producción 
primaria neta 





Área de la superficie 
del follaje 


FIGURA 4 
Producción de nutrientes. 
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Modelo lineal general 


En algunas aplicaciones, es necesario ajustar puntos de datos a algo diferente de una línea 
recta. En los ejemplos que siguen, la ecuación matricial continúa siendo XfB = y, pero la 
forma específica de X cambia de un problema a otro. Por lo general, los especialistas en es- 
tadística introducen un vector residual e, definido como e€ = y — XP, y que se escribe 


y=XB+e 


Cualquier ecuación de esta forma es un modelo lineal. Una vez que X y y están determinadas, 
el objetivo es minimizar la longitud de e, lo que equivale a encontrar una solución de mínimos 
cuadrados de XB = y. En cada caso, la solución de mínimos cuadrados Ê es una solución de 
las ecuaciones normales 


X"xXB=X"y 


Ajuste de otras curvas con mínimos cuadrados 


Cuando los puntos de datos (xj, y1),..., (Xn, Yn) en una gráfica de dispersión no se encuen- 
tran cerca de una recta, tal vez resulte pertinente postular alguna otra relación funcional 
entre x y y. 

Los siguientes dos ejemplos muestran cómo ajustar datos mediante curvas que tienen la 
forma general 


y = Po fo) + Bi fi) + + Befro (2) 


donde fo,.... f; son funciones conocidas y fo,..., By son parámetros que se deben determinar. 
Como se verá, la ecuación (2) describe un modelo lineal porque es lineal en los parámetros 
desconocidos. 

Para un valor particular de x, la ecuación (2) da un valor predicho, o “ajustado”, de y. 
La diferencia entre el valor observado y el valor predicho es el residuo. Los parámetros 
Bo,.... Bk se deben determinar para minimizar la suma de los cuadrados de los residuos. 


EJEMPLO 2 Suponga que los puntos de datos (x1, y1),..., (Xn, Yn) parecen estar sobre una 
parábola y no sobre una recta. Por ejemplo, si la coordenada x denota el nivel de producción 
de una compañía, y y representa el costo promedio por unidad de operación en un nivel de 
x unidades por día, entonces una curva típica de costo promedio parece una parábola que se 
abre hacia arriba (figura 3). En ecología, se usa una curva parabólica que se abre hacia abajo 
para modelar la producción primaria neta de nutrientes en una planta, como una función del 
área superficial del follaje (figura 4). Suponga que deseamos aproximar los datos mediante 
una ecuación de la forma 


y = Bo + Bix + Ba? 6) 


Describa el modelo lineal que produce un “ajuste de mínimos cuadrados” de los datos, 
empleando la ecuación (3). 


SOLUCIÓN La ecuación (3) describe la relación ideal. Suponga que los valores reales de 
los parámetros son Bo, Bi, 62. Entonces las coordenadas del primer punto de datos (x1, y1) 
satisfacen una ecuación de la forma 


yı = Bo + Bix + Baxi + es 


donde e; es el error residual entre el valor observado y, y el valor predicho Bo + Bix + Box? 
para y. Cada punto de datos determina una ecuación similar: 


yı = Bo + Bix + Baxi + es 
y2 = Bo + Bix + Bax3 + e 


Yn 7 Bo T Bix, + Box? + €n 
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FIGURA 5 
Puntos de datos a lo largo de una 
curva cúbica. 


Es sencillo escribir este sistema de ecuaciones en la forma y = XB + e. Para encontrar X, 
inspeccione las primeras filas del sistema y observe el patrón. 


yı 1 X1 a € 
y» 1 oxn kğ Bo €2 
AE . Bı | + 
: : : B 
Yn I taa Ga En 


EJEMPLO 3 Si los puntos de datos tienden a seguir un patrón como en la figura 5, enton- 
ces un modelo adecuado podría ser una ecuación de la forma 


y = Bo + Bix + Bar? + Bar 


Dichos datos podrían ser, por ejemplo, los costos totales de una compañía, como una función 
del nivel de producción. Describa el modelo lineal que da un ajuste de mínimos cuadrados de 
este tipo para los datos (x;, y1),..., (tn, Yn). 


SOLUCIÓN Mediante un análisis similar al efectuado en el ejemplo 2, se obtiene 


Vector de Matriz de Vector de Vector 
observaciones diseño parámetros residual 
2 3 
yı 1 X1 Xi Xi Bo €l 
2 3 
y2 1 Xo Xi Xx Bi €) 
y == , X = k L = A € = 
B2 
Yn l -Xh ye x? B3 En 


Regresión múltiple 


Suponga que en un experimento hay dos variables independientes (por ejemplo, u y v) y una 
variable dependiente, y. Una ecuación sencilla para predecir y a partir de u y v tiene la forma 


y = Bo + Piu + Bwv (4) 


Una ecuación predictiva más general podría tener la forma 


y = Bo + Biu + Bav + Bzu? + Bauv? + Bsv? (5) 


Esta ecuación se utiliza en geología, por ejemplo, para modelar superficies de erosión, gla- 
ciares, el pH del suelo y otras cantidades. En tales casos, el ajuste por mínimos cuadrados se 
llama superficie de tendencia. 

Tanto la ecuación (4) como la (5) conducen a un modelo lineal porque son lineales en 
los parámetros desconocidos (aun cuando u y v están multiplicados). En general, un modelo 
lineal surgirá siempre que y se prediga mediante una ecuación de la forma 


y = Po folu, v) + Bı filu, v) + + + Bkfku, v) 
con las funciones conocidas fo,..., fg y los pesos desconocidos fBo,..., Br. 
EJEMPLO 4 En geografía, los modelos locales del terreno se construyen mediante los 


datos (u1, v1, Y1),..., (Un, Un, Yn), donde uj, v; y y; son latitud, longitud y altitud, respectivamen- 
te. La solución es el plano de mínimos cuadrados. Véase la figura 6. 
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FIGURA 6 Un plano de mínimos cuadrados. 


SOLUCIÓN Se espera que los datos satisfagan las siguientes ecuaciones 


yı = Bo + Biu + B2v, + es 
y2 = Bo + Bin + Bv, + e2 


Ya = Bo + B14, + B2Vn + €n 


Este sistema tiene la forma matricial y = X£ + e, donde 


Vector de Matriz de Vector de Vector 
observaciones diseño parámetros residual 
yı l w v € 
y2 l wu v Bo €2 
Sa da ¿5 . |- Prol €= 
: : + . Ba 
Yn l Un n En 


El ejemplo 4 revela que el modelo lineal para regresión múltiple tiene la misma forma 
abstracta que el modelo para regresión simple de los primeros ejemplos. El álgebra lineal nos 
permite entender el principio general subyacente en todos los modelos lineales. Una vez que 
X se define adecuadamente, las ecuaciones normales para £ tienen la misma forma matricial, 
sin importar cuántas variables estén implicadas. Así, para cualquier modelo lineal donde XTX 
sea invertible, el B de mínimos cuadrados está dado por (X"X)71X? y. 


Lecturas adicionales 


Ferguson, J., Introduction to Linear Algebra in Geology (Nueva York: Chapman Hall, 
1994). 


Krumbein, W. C. y F. A. Graybill, An Introduction to Statistical Models in Geology (Nueva 
York: McGraw-Hill, 1965). 


Legendre, P. y L. Legendre, Numerical Ecology (Amsterdam: Elsevier, 1998). 


Unwin, David J., An Introduction to Trend Surface Analysis, Concepts and Techniques in 
Modern Geography, No. 5 (Norwich, Inglaterra: Geo Books, 1975). 


PROBLEMA DE PRÁCTICA 


Cuando las ventas mensuales de un producto están sujetas a las fluctuaciones estacionales, 
entonces una curva que aproxime los datos de venta podría tener la forma 


y = Bo + Bix + Ba sen (271x/12) 


donde x es el tiempo en meses. El término fp + fx da la tendencia básica de ventas, y el 
término seno refleja los cambios estacionales en las ventas. Determine la matriz de diseño y 
el vector de parámetros para el modelo lineal que conduce a un ajuste de mínimos cuadrados 
de la ecuación anterior. Suponga que los datos son (xj, y1),..., (Xn, Yn). 
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6. 


6 EJERCICIOS 


En los ejercicios 1 a 4, encuentre la ecuación y = Bo + B¡x de la 
recta de mínimos cuadrados que mejor se ajuste a los puntos de datos 
indicados. 


10. 


(0, 1), (1, 1), (2, 2), 3, 2) 
(1, 0), (2, 1), (4, 2), (5, 3) 
(=D, (0, D, (1, 2), (2, 4) 
Q, 3), (3, 2), (5, 1), (6, 0) 


Sea X la matriz de diseño empleada para determinar la rec- 
ta de mínimos cuadrados que se ajusta a los datos (xj, y1),..., 
(Xn, Yn). Utilice un teorema de la sección 6.5 para demostrar 
que las ecuaciones normales tienen solución única si y solo si 
los datos incluyen al menos dos puntos de datos con diferente 
coordenada x. 


Sea X la matriz de diseño del ejemplo 2 correspondiente a un 
ajuste de mínimos cuadrados de los datos (xj, y1),..., (tn, Yn) 
a una curva parabólica. Suponga que x;, x2 y x3 son distintas. 
Explique por qué solo existe una parábola que mejor se ajus- 
ta a los datos, en el sentido de mínimos cuadrados. (Véase el 
ejercicio 5). 

Un cierto experimento genera los datos (1, 1.8), (2, 2.7), 
(3, 3.4), (4, 3.8), (5, 3.9). Describa el modelo que produce un 
ajuste de mínimos cuadrados de esos puntos mediante una 
función de la forma 


y = Bix + Bar? 

Se podría presentar dicha función, por ejemplo, como el ingreso 
derivado de la venta de x unidades de un producto, cuando la 
cantidad ofrecida para la venta afecta el precio del producto. 


a) Determine la matriz de diseño, el vector de observaciones y 
el vector de parámetros desconocidos. 


b) [M] Encuentre la curva de mínimos cuadrados asociada con 
los datos. 


Una curva sencilla que con frecuencia es un buen modelo para 
los costos variables de una compañía, como una función del ni- 
vel x de ventas, tiene la forma y = Bix + Box? + B3x?. No existe 
término constante porque no se incluyen los costos fijos. 


a) Determine la matriz de diseño y el vector de parámetros para 
el modelo lineal que conduce a un ajuste de mínimos cuadra- 
dos de la ecuación anterior, con los datos (x;, y1),..., (Xn, Yn)- 


b) [M] Encuentre la curva de mínimos cuadrados de la for- 
ma anterior para ajustar los datos (4, 1.58), (6, 2.08), (8, 
2.5), (10, 2.8), (12, 3.1), (14, 3.4), (16, 3.8) y (18, 4.32), con 
valores en miles. Si es posible, realice una gráfica que mues- 
tre los puntos de datos y la curva de aproximación cúbica. 


Un cierto experimento genera los datos (1, 7.9), (2, 5.4) y 
(3, —.9). Describa el modelo que da un ajuste de mínimos cua- 
drados de esos puntos mediante una función de la forma 


y =A cosx + B senx 


Suponga que las sustancias radiactivas A y B tienen constantes 
de decaimiento de .02 y .07, respectivamente. Si en el momento 
t = O una mezcla de esas dos sustancias contiene MA gramos de 
A y Mg gramos de B, entonces un modelo para la cantidad total 
y de la mezcla presente en el momento t es 


y= Me oz 4 Mpge™ 


Suponga que no se conocen las cantidades iniciales Ma y Mp, 
pero un científico logra medir las cantidades totales presentes 
en diferentes momentos y registra los siguientes puntos (t;, y;): 
(10, 21.34), (11, 20.68), (12, 20.05), (14, 18.87) y (15, 18.30). 


a) Describa un modelo lineal que se pueda utilizar para estimar 
M AY M B- 


b) [M] Encuentre la curva de mínimos cuadrados basada en la 
ecuación (6). 





11. 


12. 


En 1986 fue la última aparición del cometa Halley, el cual rea- 
parecerá en el año 2061. 


[M] De acuerdo con la segunda ley de Kepler, un cometa de- 
bería tener una órbita elíptica, parabólica o hiperbólica (igno- 
rando las atracciones gravitacionales de los planetas). En con- 
venientes coordenadas polares, la posición (r, 9) de un cometa 
satisface una ecuación de la forma 


r= B + e(r: cos 9) 

donde £ es una constante y e es la excentricidad de la órbita, con 
0 =e< 1 para una elipse, e = 1 para una parábola, y e > 1 para 
una hipérbola. Suponga que los siguientes datos corresponden a 
las observaciones de un cometa recién descubierto. Determine 


el tipo de la órbita e indique dónde estará el cometa cuando 
0 = 4.6 radianes.’ 


y | .88 110 142 1.77 2.14 
r | 3.00 2.30 1.65 1.25 1.01 





[M] La presión sanguínea sistólica p (en milímetros de mer- 
curio) de un niño saludable y su peso w (en libras) están relacio- 
nados aproximadamente mediante la ecuación 


Bo + Bilnw =p 
Utilice los siguientes datos experimentales para estimar la 


presión sanguínea sistólica de un niño saludable que pesa 
100 libras. 


3 La idea básica del ajuste de mínimos cuadrados de los datos se debe a 


K. F. Gauss (e, independientemente, a A. Legendre), cuya fama despuntó 
en 1801 cuando utilizó el método para obtener la trayectoria del asteroide 
Ceres. Cuarenta días después de que el asteroide fue descubierto, desapare- 
ció detrás del Sol. Gauss predijo que Ceres aparecería 10 meses después y 
precisó su ubicación. La exactitud de la predicción asombró a la comunidad 
científica europea. 


w 44 61 81 113 131 
linw | 3.78 4.11 439 4.73 4.88 
p 91 98 103 110 112 











13. [M] Para medir el desempeño de un avión durante el despegue, 
cada segundo se midió su posición horizontal, de t = 0 a t = 12. 
Las posiciones (en pies) fueron: 0, 8.8, 29.9, 62.0, 104.7, 159.1, 
222.0, 294.5, 380.4, 471.1, 571.7, 686.8, y 809.2. 


a) Encuentre la curva cúbica de mínimos cuadrados y = Bp + 
Bit + Bat? + Bat? para esos datos. 


b) Con base en el resultado del inciso a), estime la velocidad 
del avión cuando £ = 4.5 segundos. 


1 1 
14. Sean x= (01 ++": +2%5) y PASA: De 


muestre que la recta de mínimos cuadrados para los datos 
(X1, Y1),...> (tn, Yn) debe pasar a través de (x, y). Es decir, de- 
muestre que x y y satisfacen la ecuación lineal y = Bo + Bix. 
[Sugerencia: Deduzca esta ecuación mediante la ecuación 
vectorial y = XB + e. Denote la primera columna de X con 1. 
Con base en el hecho de que el vector residual e es ortogonal 
al espacio columna de X y, por lo tanto, es ortogonal a 1]. 


Considerando los datos para un problema de mínimos cuadrados, (x1, 
Y1),..., (tn, yn), son útiles las siguientes abreviaciones: 


AOS E a 
IED ANS A 


Las ecuaciones normales para una recta de mínimos cuadrados 
y = Bo + Bix se pueden escribir en la forma 


nfo+ BID x=YD y 
Êb xt Ê =E xy 


15. Deduzca las ecuaciones normales (7) a partir de la forma matri- 
cial presentada en esta sección. 


(7) 


16. Utilice una matriz inversa para resolver el sistema de ecua- 
ciones (7) y así obtener las fórmulas para Bo y B1 que aparecen 
en muchos libros de estadística. 


6.6 Aplicaciones a modelos lineales 375 


17. a) Rescriba los datos del ejemplo 1 con nuevas coordenadas x 
en la forma de desviación media. Sea X la matriz de diseño 
asociada. ¿Por qué son ortogonales las columnas de X? 


b) Escriba las ecuaciones normales para los datos del inciso a), 
y resuélvalas para encontrar la recta de mínimos cuadrados, 
y = Bo + fBix*, donde x* = x — 5.5. 


18. Suponga que las coordenadas x de los datos (x1, y1),..., (Xn, Yn) 
están en la forma de desviación media, así que >x; = 0. De- 
muestre que si X es la matriz de diseño para la recta de mínimos 
cuadrados de este caso, entonces XX es una matriz diagonal. 


Los ejercicios 19 y 20 implican a una matriz de diseño X con dos o 
más columnas y una solución de mínimos cuadrados f de y = XB. 
Considere los siguientes números. 


i. IXBI?, la suma de los cuadrados del “término de regresión”. 
Denote este número con SS(R). 


ii. ly — XBl?, la suma de los cuadrados para el término de 
error. Denote este número con SS(B). 














iii. ||y|?, la suma “total” de los cuadrados de los valores y. 
Denote este número con SS(T). 


Todos los libros de estadística analizan el tema de la regresión, y el 
modelo lineal y = XB + e introduce esos números, aunque la nota- 
ción y la terminología tal vez varíen de un texto a otro. Para simplifi- 
car el asunto, suponga que la media de los valores y es cero. En este 
caso, SS(T) es proporcional a la varianza del conjunto de valores y. 


19. Justifique la ecuación SS(T) = SS(R) + SS(E). [Sugerencia: 
Utilice un teorema, y explique por qué se satisfacen las hipótesis 
del teorema]. Esta ecuación es extremadamente importante en 
estadística, en la teoría de regresión y en el análisis de varian- 
za. 


20. Demuestre que ||XÊ|? = ÊT XTy. [Sugerencia: Rescriba el lado 
izquierdo y considere el hecho de que Ê satisface las ecuaciones 
normales]. Esta fórmula para SS(R) se emplea en estadística. 
Con base en esto y en el ejercicio 19, obtenga la fórmula están- 
dar para SS(E): 


SS(E) = y "y — ÊT XT y 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Construya X y £ tal que la k-ésima fila de Xf sea el valor de y predicho correspondiente al 


punto de datos (xp, yk), a saber, 


Debería ser claro que 


Tendencia de ventas con 
fluctuaciones estacionales. 


Bo + Bix + B2 sen (27 x/12) 


xı sen(21x,/12) Bo 
: : >. =|. 
Xp  sen(21x,/12) B2 
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6.7 | ESPACIOS CON PRODUCTO INTERIOR 


DEFINICIÓN 


Los conceptos de longitud, distancia y ortogonalidad son esenciales en aplicaciones que im- 
plican un espacio vectorial. Para [R”, esos conceptos se basaron en las propiedades del pro- 
ducto interior indicadas en el teorema 1 de la sección 6.1. Para otros espacios, se necesitan 
analogías del producto interior con las mismas propiedades. Ahora las conclusiones del teo- 
rema 1 se convierten en axiomas en la siguiente definición. 


Un producto interior sobre un espacio vectorial V es una función que asocia un núme- 
ro real (u, v) para cada par de vectores u y v en V, y satisface los siguientes axiomas, 
para toda u, v, w en V, y todos los escalares c: 

1. (u, v) = (v, u) 

2. (u + v, w) = (u, w) + (v, w) 

3. (cu, v) = clu, v) 


4. (uu)=0 y (uu)=0siysolosiu =Ó0 


Un espacio vectorial con un producto interior se llama espacio con producto interior. 


El espacio vectorial R” con el producto interior estándar es un espacio con producto 
interior, y casi todo lo analizado en este capítulo para R” también es válido para los espacios 
con producto interior. Los ejemplos en esta sección y la siguiente establecen el fundamento 
para una variedad de aplicaciones que se estudian en cursos de ingeniería, física, matemáticas 
y estadística. 


EJEMPLO 1 Elija dos números positivos cualesquiera, por ejemplo, 4 y 5; para los 
vectores u = (u1, u2) y V = (vı, v2) en R?, establezca 


(u, v) = 4u1U1 + 5472 (1) 


Demuestre que la ecuación (1) define un producto interior. 


SOLUCIÓN Sin duda, el axioma 1 se satisface, porque (u, v) = 4ujv; + Suzuv, = 4uu; + 
Svu = (v, u). Si w = (w1, w2), entonces, 


(u + v, w) = 4(u, + 0,)w1 + 5(u2 + v2)w2 
= 4u41Ww¡ + 5u42Ww + 4v,w1 + 5vU2Ww2 


= (u, w) + (v, w) 
Esto comprueba el axioma 2. Para el axioma 3, calcule 
(cu, v) = 4(cui)vi + 5(cu2)v2 = c(4u1v1 + 5u20v2) = c (Uu, v) 


Para el axioma 4, observe que (u, u) = 4u? + 5uz >0y 4u? + 5u2 = 0 solo si u; = m = 0, 
es decir, si u = 0. Además, (0, 0) = 0. Así, (1) define un producto interior sobre R2. E 


Sobre R” se pueden definir productos interiores similares a (1), que surgen naturalmente 
en problemas de “mínimos cuadrados ponderados”, en los cuales los pesos se asignan a las 
diversas entradas en la suma para el producto interior de manera que se dé mayor importancia 
a las mediciones más confiables. 

De ahora en adelante, cuando un espacio con producto interior implique polinomios u 
otras funciones, se escribirán las funciones en la forma usual, en vez de emplear negritas para 
los vectores. Sin duda, es importante recordar que cada función es un vector cuando se trata 
como un elemento de un espacio vectorial. 
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EJEMPLO 2 Sean to,..., f, números reales distintos. Para p y q en P,,, defina 
(p,q) = pltoYglto) + PDI) + + Pnad Cta) Q) 
Es sencillo comprobar los axiomas 1 a 3 del producto interior. Para el axioma 4, observe que 
(P; P) = PEOP + PED + E a o 


Además, (0, 0) = 0. (Aquí el cero en “negritas” denota el polinomio cero, el vector cero en 
P,,). Si ( p, p) = 0, entonces p se debe anular en n + 1 puntos: to,..., fn. Esto solo es posible 
si p es el polinomio cero, porque el grado de p es menor que n + 1. Así, (2) define un pro- 
ducto interior en P,,. E 


EJEMPLO 3 Considere que V está en P}, con el producto interior del ejemplo 2, donde 
to =0, t, = 1, yh = 1. Sean p(t) = 128? y q(t) = 2t — 1. Calcule (p, q) y (q, q). 


SOLUCIÓN 


(p.a) = p(0)4(0) + p (3) 4 (3) + 20401) 
= (06D) +00) + 19) = 12 


(q, q) = OP + la (GE + aF 
= (1? + (0? + (1? =2 E 


Longitudes, distancias y ortogonalidad 


Sea V un espacio con producto interior, con el producto interior denotado con (u, v}. Igual que 
en R”, defina la longitud, o norma, de un vector v como el escalar 


Ivii = v (v, v) 





De manera equivalente, [lv]? = (v, v). (Esta definición tiene sentido porque (v, v) = 0, 
pero la definición no dice que (v, v} sea una “suma de cuadrados” porque v no necesita ser 
un elemento de R”). 

Un vector unitario es aquel cuya longitud es 1. La distancia entre u y v es |u — vl]. 
Los vectores u y v son ortogonales si (u, v) = 0. 


EJEMPLO 4 Suponga que [P, tiene el producto interior (2) del ejemplo 3. Calcule las 
longitudes de los vectores p(t) = 12? y q(t) = 21 — 1. 


SOLUCIÓN 
IpI? = (p. p) = POP + [p HF + pP 
=0 + [3]? + [12]? = 153 
lpl = v153 
Del ejemplo 3, (q, q) = 2. Por lo tanto, q] = V/2. 


Proceso de Gram-Schmidt 


La existencia de bases ortogonales para subespacios de dimensión finita de un espacio vec- 
torial con producto interior se puede establecer con el proceso de Gram-Schmidt, al igual 
que en R”. Mediante este proceso, es posible construir ciertas bases ortogonales que surgen a 
menudo en las aplicaciones. 

La proyección ortogonal de un vector sobre un subespacio W con una base ortogonal se 
puede construir en la forma habitual. La proyección no depende de la base ortogonal selec- 
cionada, y tiene las propiedades descritas en los teoremas de descomposición ortogonal y de 
la mejor aproximación. 
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EJEMPLO 5 Considere que V está en P4 con el producto interior del ejemplo 2, lo que 
implica evaluación de polinomios en —2, —1, 0, 1 y 2, y que P, es un subespacio de V. Obtenga 
una base ortogonal para [P, aplicando el proceso de Gram-Schmidt a los polinomios 1, t y ?. 


SOLUCIÓN El producto interior sólo depende de los valores de un polinomio en —2,..., 2, 
así que se listan los valores de cada polinomio como un vector en R?, debajo del nombre de 
cada polinomio: ! 


Polinomio: 1 t {2 
1 —2 4 
1 —1 1 
Vector de valores: | 1 |, 0 |, 0 
1 1 1 
1 2 4 


El producto interior de dos polinomios en V es igual al producto interior (estándar) de sus 
vectores correspondientes en R5. Observe que £ es ortogonal a la función constante 1. Así, 
se toman pot) = 1 y pi(t) = t. Para p, utilice los vectores en R para calcular la proyección 
de 1? sobre Gen po, pi): 


(2, po) = (49,1) =4+1+0+1+4=10 
(Po, Po) = 
(£, pi) = (t,t) = -8 + C1)+0+1+8=0 


La proyección ortogonal de 1? sobre Gen (1, £) es 1 Po + Opı. Por consiguiente, 
PRE == 2po(t) =t -2 


Una base ortogonal para el subespacio P, de V es: 


Polinomio: Po pı p2 
1 -2 2 
1 =1 -1 

Vector de valores: | 1 |, 01, -2 (3) 
1 1 -1 
1 2 2 

E 


Mejor aproximación en espacios con producto interior 


Un problema común en matemáticas aplicadas implica un espacio vectorial V cuyos elemen- 
tos son funciones. El problema es aproximar una función fen V mediante una función g de un 
subespacio especificado W de V. La “cercanía” de la aproximación de f depende de la manera 
en que se defina ||f — gll. Solo se considerará el caso en que la distancia entre f y g esté de- 
terminada por un producto interior. En tal caso, la mejor aproximación a f mediante funciones 
en W es la proyección ortogonal de f sobre el subespacio W. 


EJEMPLO 6 Considere que V está en [P4 con el producto interior del ejemplo 5; consi- 
dere también que po, pi y p2 constituyen la base ortogonal que se encontró en el ejemplo 5 
para el subespacio P2. Determine la mejor aproximación a p(t) = 5 — 114 mediante poli- 
nomios en P3}. 


1 Cada polinomio en P; está determinado de manera unívoca por su valor en los cinco números —2,..., 2. De hecho, 
la correspondencia entre p y su vector de valores es un isomorfismo, es decir, un mapeo uno a uno sobre R? que 
preserva combinaciones lineales. 


IbvIl Ily — proy py vil 


E proy ¡y Y 


0 IIproy ¡y vIl 


FIGURA 2 
La hipotenusa es el lado 
más largo. 


TEOREMA 16 
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SOLUCIÓN Los valores de po, p, y p2 en los números —2, —1, 0, 1 y 2 están listados en 
los vectores de R5 en (3). Los valores correspondientes para p son —3, 9/2, 5, 9/2 y —3. 
Calcule 


(p, pa) = —31 
(pa, pa) = 14 


(Pp, Po) = 8, (p, pı) =0, 


(po, Po) = 5, 


Así, la mejor aproximación en V a p mediante polinomios en P, es 


(P, Po) (P. pi) (p, p2) p 
(Po, Po) (pı, Pı) (p2, p2) l 
3 


ip + Fm = $- e-n). 





Î = proyp, P = 


De todos los polinomios en [P», este es el más cercano a p cuando la distancia entre polino- 
mios se mide solo en —2, —1, 0, 1 y 2. Véase la figura 1. A 

















FIGURA 1 


Los polinomios po, p1 y p2 de los ejemplos 5 y 6 pertenecen a una clase de polinomios 
que en estadística se denominan polinomios ortogonales.? La ortogonalidad se refiere al tipo 
de producto interior descrito en el ejemplo 2. 


Dos desigualdades 


Considerando un vector v en un espacio V con producto interior y dado un subespacio W de 
dimensión finita, se aplica el teorema de Pitágoras a la descomposición ortogonal de y con 
respecto a W y se obtiene 


IMP = (Iproyw viP + [lv — proyw v]P 


Véase la figura 2. En particular, esto muestra que la norma de la proyección de v sobre W 
no excede la propia norma de v. Esta sencilla observación conduce a la siguiente importante 
desigualdad. 


Desigualdad de Cauchy-Schwarz 


Para toda u y v en V, 


(u, v| = jul! [lvl (4) 


2 Véase Statistics and Experimental Design in Engineering and the Physical Sciences, 2a. ed., de Norman L. Johnson 
y Fred C. Leone (Nueva York: John Wiley & Sons, 1977). En este libro las tablas listan los “polinomios ortogonales”, 
que son simplemente los valores de los polinomios en números como —2, —1, 0, 1 y 2. 


380 CAPÍTULO 6 Ortogonalidad y mínimos cuadrados 


TEOREMA 17 
v u+y 
[lu + vil 
Ivi 
0 llull u 


FIGURA 3 
Las longitudes de los lados 
de un triángulo. 


DEMOSTRACIÓN Siu = 0, entonces ambos lados de (4) son iguales a cero, por lo tanto, la 
desigualdad es verdadera en este caso. (Véase el problema de práctica 1). Si u # 0, sea W el 
subespacio generado por u. Recuerde que ||cul]| = |c| [jul| para cualquier escalar c. Así, 























lproyw vl| = | (x, "a — Wl aj = lag = E 
(u, u) | (u, u)| lull? lull 
Hu, v)] e 
Puesto que lproy y vl| = l|vl|, se tiene MET < ||vll, lo que da la ecuación (4). a 
u 


La desigualdad de Cauchy-Schwarz es útil en muchas ramas de las matemáticas. En los 
ejercicios se presentan unas cuantas aplicaciones. Esta desigualdad es necesaria para probar 
otra desigualdad fundamental que implica normas de vectores. Véase la figura 3. 


Desigualdad del triángulo 


Para toda u y v en V, 


lu + v| = [lul] + [lv] 


DEMOSTRACIÓN 


|u +v]? = (u + v,u + v) = (u, u) + 2({u, v) + (v, v) 


< [Jul]? + 2/(u, v)] + [IvI? 
< Jul? +2/ul! Iv] + | v]1? Cauchy-Schwarz 
= (al + Ivi? 


La desigualdad del triángulo se deduce inmediatamente al sacar la raíz cuadrada en ambos 
lados. E 


Un producto interior para C[a, b] (se requiere cálculo) 


Quizás el espacio con producto interior más ampliamente utilizado en aplicaciones sea el 
espacio vectorial C[a, b] de todas las funciones continuas en un intervalo a S t S b, con 
un producto interior que enseguida se describirá. 

Se inicia considerando un polinomio p y cualquier entero n mayor o igual que el grado 
de p. Entonces p está en P,„, y se puede calcular una “longitud” para p utilizando el produc- 
to interior del ejemplo 2 que implica evaluación en n + 1 puntos en [a, b]. Sin embargo, esta 
longitud de p solo capta el comportamiento en esos n + 1 puntos. Como p está en [P,, para 
todas las n grandes, se podría utilizar un valor de n bastante grande, con mucho más puntos 
para la “evaluación” asociada con el producto interior. Véase la figura 4. 


a po] b a VILLE) b 
Lp) 


FIGURA 4 Uso de diferentes números de puntos de evaluación en [a, b] para 
calcular |p|. 
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Se particiona [a, b] en n + 1 subintervalos de longitud Az = (b — a)/(n + 1), y sean 
to,..., f, puntos arbitrarios en esos subintervalos. 


—A Af kk 


a h 


os 
>` 


Si n es grande, el producto interior sobre [P,, determinado por fp,..., ty tenderá a dar un gran 
valor para (p, p), así que se reduce a escala y se divide entre n + 1. Observe que 1/(n + 1) 
= At/(b — a), y se define 


1 


(p,q) = nil 


n 1 n 
S peat) = a XO papat) At 
j=0 j=0 


Ahora, n crece sin límite. Puesto que los polinomios p y q son funciones continuas, entonces 
la expresión entre corchetes es una suma de Riemann que se aproxima a una integral definida, 
lo que conduce a considerar el valor promedio de p(t)q(t) sobre el intervalo [a, b]: 


1 b 
a] row 


Esta cantidad está definida para polinomios de cualquier grado (de hecho, para todas las 
funciones continuas), y tiene todas las propiedades de un producto interior, como lo muestra 
el siguiente ejemplo. El factor de escala 1/(b — a) no es esencial y con frecuencia se omite 
con la finalidad de simplificar. 


EJEMPLO 7  Paraf, g en Cla, b], sea 


b 
(£.g)= | fOgA) dt (5) 


Demuestre que la ecuación (5) define un producto interior sobre C[a, b]. 


SOLUCIÓN Los axiomas 1 a 3 del producto interior se deducen de las propiedades elemen- 
tales de las integrales definidas. Para el axioma 4, observe que 


b 
EE f FP dr >0 


La función [f(t)1? es continua y no negativa en [a, b]. Si la integral definida de [f(1)]? es 
cero, entonces [f(t]? debe ser idénticamente cero sobre [a, b], de acuerdo con un teorema 
en cálculo avanzado; en tal caso, f es la función cero. Así (f, f} = O implica que f es la fun- 
ción cero en [a, b]. Por lo tanto, (5) define un producto interior sobre C[a, b]. E 


EJEMPLO 8 Sean V el espacio C[O, 1] con el producto interior del ejemplo 7, y W el 
subespacio generado por los polinomios pi( = 1, pÀ = 2t — 1 y pÀ = 12¢. Utilice 
el proceso de Gram-Schmidt y encuentre una base ortogonal para W. 


SOLUCIÓN Sea qı = pı, y calcule 


1 


1 
(p2.q1) = / Qt- DO dt =(2-t)| =0 
0 
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De manera que pz ya es ortogonal a q1, y se puede tomar q2 = p2. Para la proyección de p3 
sobre W, = Gen {q1, q2}, se calcula 


1 
(p3,q1) = / 121? .1dt = 41? 
0 


1 
a= f bidis 
0 


1 
=4 
0 





Í 
=1 
0 





J: 1 
wa) = f 12er- d= f (241? — 121?) dt =2 
0 0 


1 
(q2, q2) = j Qt- di = 22t- 0 


Entonces 


(p3,41) 


1 


0 





i 2 
y 2a) q = 4qı + 6q2 





proy w, P3 = ( 


q1,91) 


4 
== + 
(q2, 2) ETE 1/3 


43 = P3 — Proy w, p3 = p3 — 4q1 — 6q2 


Como una función, q3(t1) = 12t? — 4 — 6(2t — 1) = 121? — 121 + 2. La base ortogonal para 
el subespacio Wes [q1, q2, q3). 


PROBLEMAS DE PRÁCTICA 


Aplique los axiomas del producto interior para comprobar los siguientes enunciados. 


(v, 0) = (0, v) =0. 


1. 
2. (u,v + w) = (u, v) + (u, w). 


EJERCICIOS 


Suponga que R? tiene el producto interior del ejemplo 1, y sean 
x=(1,1)yy = (5, —1). 

|. llyll y Ka, y)P. 

b) Describa todos los vectores (z1, z2) que son ortogonales a y. 











a) Encuentre |x 


Considere que R? tiene el producto interior del ejemplo 1. De- 
muestre que la desigualdad de Cauchy-Schwarz es válida para 
x = (3, -2) y y = (22, 1). (Sugerencia: Estudie [(x, y)/?). 


Los ejercicios 3 a 8 se refieren a [Pz con el producto interior dado por 
evaluación en —1, 0 y 1. (Véase el ejemplo 2). 


3. 


4 
5. Obtenga [|p|| y l|g 
6. 
7 


Calcule (p, q), donde p(t) =4 ++t,q(t) =5 - 41?. 


. Calcule (p, q}, donde p(t) = 3t — t°, q(t) = 3 + 22°. 








, para p y q del ejercicio 3. 








Obtenga ||p|| y |ląl|, para p y q del ejercicio 4. 


. Determine la proyección ortogonal de q sobre el subespacio 


generado por p, para p y q en el ejercicio 3. 


Obtenga la proyección ortogonal de q sobre el subespacio ge- 
nerado por p, para p y q en el ejercicio 4. 


10. 


11. 


12. 


Considere que [Py tiene el producto interior dado por evaluación 

en —-3, —1, 1 y 3. Sean pol) = 1, pi(0) =1 y pa(0) = P. 

a) Calcule la proyección ortogonal de pz sobre el subespacio 
generado por po y pı. 


b) Encuentre un polinomio q que sea ortogonal a po y pı, tal 
que {po, pı, q} sea una base ortogonal para Gen {po, p1, p2}. 
Escale el polinomio q de modo que su vector de valores en 
(—3, —1, 1, 3) sea (1, —1, —1, 1). 


Considere que [Pz tiene el producto interior del ejercicio 9, 
con los polinomios po, pi y q ahí descritos. Determine la 
mejor aproximación a p(f) = t? mediante polinomios en 
Gen (po, pı, q}. 


Suponga que po, pi y p2 son los polinomios ortogonales des- 
critos en el ejemplo 5, donde el producto interior sobre [P4 está 
dado por evaluación en —2, —1, 0, 1 y 2. Encuentre la pro- 
yección ortogonal de 13 sobre Gen (po, p1, p2). 


Obtenga un polinomio pz tal que (po, p1, pa, p3) (véase el ejer- 
cicio 11) sea una base ortogonal para el subespacio [Pz de Pa. 
Escale el polinomio p3 de manera que su vector de valores sea 
(1,2, 0, —2, 1). 
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13. Sea A una matriz invertible de n x n. Demuestre que para u, v Los ejercicios 21 a 24 se refieren a V = C[O, 1], con el producto 
en R”, la fórmula (u, v) = (4u)- (4v) = (4u)7 (Av) define un interior dado por una integral, como en el ejemplo 7. 


ducto interi bre R”. 
A 21. Calcule (f, 8), donde f(t) = 1 — 3t? y g) = t — t’. 


14. Sea T una transformación lineal uno a uno de un espacio 
vectorial V en R”. Demuestre que para u, v en V, la fórmula 
(u, v) = 7 (u)-7 (v) define un producto interior sobre V. 23. Obtenga ||f|| para la f del ejercicio 21. 


22. Determine (f. g), donde f(t) = 51 — 3 y g(t) = P — £?. 


Utilice los axiomas del producto interior y otros resultados de esta 24, Calcule ||g|| para la g del ejercicio 22. 


sección para comprobar los enunciados de los ejercicios 15 a 18. . aia . 
25. Sea V el espacio C[—1, 1] con el producto interior del ejemplo 


15. (u, cv) = c(u, v) para todos los escalares c. 7. Encuentre una base ortogonal para el subespacio generado 
por los polinomios 1, £ y £?. Los polinomios en esta base se 


16. Si {u, v} es un conjunto ortonormal en V, entonces . : 
llaman polinomios de Legendre. 


lu- vl = v2, i 
26. Sea V el espacio C[—2, 2] con el producto interior del ejemplo 
17. (u,v) = A + vi]? — 1u — v]? 7. Obtenga una base ortogonal para el subespacio generado por 


los polinomios 1, £ y 1?. 
18. |u + v|? + Ju — vll? = 2l/ull? + 2v1? 


ya Jb 27. [M] Considere que P; tiene el producto interior como en el 
19. Dados a = 0 y b = 0, sean u = M Y NE [50] ejemplo 5, y sean po, pi, p2 los polinomios ortogonales de ese 


a . ejemplo. Con su programa de matrices, aplique el proceso de 
Aplique la desigualdad de Cauchy-Schwarz para comparar la Gram-Schmidt al conjunto (po, pi, p», 13, 1*) y cree una base 
media geométrica Vab con la media aritmética (a + b)/2. ortogonal para Pa 

a 1 0 : 
20. Sean u= | A y v= | 1 | Utilice la desigualdad de 28. [M] Sea V el espacio C[0, 27] con el producto interior del ejem- 
plo 7. Aplique el proceso de Gram-Schmidt con la finalidad 
de crear una base ortogonal para el subespacio generado por 
E a - ap {1, cost, cos?r, cos?t}. Utilice un programa de matrices o 


Cauchy-Schwarz para demostrar que 








2 2 computacional para calcular las integrales definidas adecuadas. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Por el axioma 1, (v,0) = (0, v). Entonces (0, v) = (Ov, v) = O(v, v), por el axioma 3, 
de manera que (0, y) = 0. 

2. Porlos axiomas 1 y 2, y después 1 otra vez, (u, v + w) = (v+ w,u) = (v,u) + (w,u) = 
(u, v) + (u, w). 


6.8 | APLICACIONES DE ESPACIOS CON PRODUCTO INTERIOR 


Los ejemplos de esta sección ilustran cómo surgen en problemas prácticos los espacios con 
producto interior definidos en la sección 6.7. El primer ejemplo se relaciona con el inmenso 
problema de mínimos cuadrados de actualización del North American Datum, descrito en el 
ejemplo introductorio de este capítulo. 


Mínimos cuadrados ponderados 


Sea y un vector de n observaciones, y1,..., Yn, y Suponga que se desea aproximar y median- 
te un vector Y que pertenece a determinado subespacio de IR”. (En la sección 6.5, $ se escri- 
bió como Ax, de manera que Y estuviera en el espacio columna de A). Denote las entradas 
en $ como $1,..., 9». Entonces la suma de los cuadrados de los errores, o SS(E), al aproximar 


y por y es 
SS(E) = (1 $07 +++ O — Ín)* (1) 





Esto es simplemente ly — $|?, utilizando la longitud estándar en RR”. 
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Ahora suponga que las mediciones que generaron las entradas en y no son igualmente 
confiables. (Este fue el caso para el North American Datum, porque las mediciones se realiza- 
ron durante un periodo de 140 años). Como otro ejemplo, las entradas en y se podrían calcular 
a partir de varias muestras de medidas, con tamaños de muestra desiguales). Entonces, resulta 
adecuado ponderar los errores cuadráticos de la ecuación (1) de tal manera que se dé mayor 
importancia a las mediciones más confiables.! Si los pesos se denotan como wi, Hd w?, en- 
tonces la suma ponderada de los errores cuadráticos es 


SS(E) ponderada = wi (yı — f1)? +- + w20, — $)? 2) 


Este es el cuadrado de la longitud de y — Y, donde la longitud se deduce a partir de un pro- 
ducto interior análogo al del ejemplo 1 de la sección 6.7, a saber, 


2 2 
(X, y) = WIX1Y1 +00 Xp Y 
Algunas veces es conveniente transformar un problema de mínimos cuadrados pondera- 


dos en un problema equivalente de mínimos cuadrados ordinario. Sea W la matriz diagonal 
con wj,..., W, (positivos) en su diagonal, de manera que 


wi 0 ... 0 yı w1yı 

0 w y2 w2y2 
Wy = = 

0 SAREN Wn Yn Wn Yn 


con una expresión similar para WY. Observe que el j-ésimo término en la ecuación (2) se 
puede escribir como 


wO; -— fY = (wyj -wp 


Se deduce que la SS(E) ponderada en la ecuación (2) es el cuadrado de la longitud ordinaria 
en R” de Wy — WẸ, que se puede representar en la forma ||Wy — W9!l?. 

Ahora suponga que el vector de aproximación $ se construirá mediante las columnas 
de A. Entonces se busca una X que haga que AX = $ esté tan cerca de y como sea posible. 
Sin embargo, la medida de cercanía es el error ponderado, 


[Wy — W3l? = [Wy — Wax? 
Así, X es la solución (ordinaria) de mínimos cuadrados de la ecuación 
WAx = Wy 


La ecuación normal para la solución de mínimos cuadrados es 
(WA)"WAx = (WA) Wy 


EJEMPLO 1 Encuentre la recta de mínimos cuadrados y = Bo + fx que mejor se ajuste 
a los datos (—2, 3), (— 1, 5), (0, 5), (1, 4) y (2, 3). Suponga que los errores al medir los valores 
y de los dos últimos puntos de datos son más grandes que para los demás puntos. Pondere 
estos datos a la mitad en relación con los datos restantes. 


1 Nota para lectores con conocimientos de estadística: Suponga que los errores al medir y; son variables aleatorias 


independientes con media igual a cero y varianzas o?, s g2: Entonces, los pesos adecuados en la ecuación (2) son 


w? =1/ g Cuanto mayor sea la varianza del error, menor será el peso. 





-2 2 


FIGURA 1 
Rectas de mínimos cuadrados 
ordinaria y ponderada. 
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SOLUCIÓN Como en la sección 6.6, escriba X para la matriz A y ß para el vector x, y 
obtenga 


1-2 3 
1-1 5 
X=|1 0l, asje], y=]5 
1 1l Bi 4 
1 2 3 


Para una matriz de ponderación, seleccione W con entradas diagonales 2, 2, 2, 1 y 1. Al mul- 
tiplicar por la izquierda por W se escalan las filas de X y y: 


Daci 
ES) 10 
wx=]|2 0|, Wy=|10 
1 1 4 
1 2 3 


Para la ecuación normal, calcule 


(WX)"WX = E al y (WX)Wy= Es 


14 —9|| Bo | 59 

=9 25|| B|  |-34 
La solución de la ecuación normal es (a dos dígitos significativos) Bọ = 4.3 y Bı = .20. La rec- 
ta deseada es 


y resuelva 


y = 4,3 + .20x 
En contraste, la recta de mínimos cuadrados ordinaria para estos datos es 
y = 4.0 — .10x 


En la figura 1 se representan ambas rectas. E 


Análisis de tendencia de datos 


Sea f una función desconocida cuyos valores se conocen (quizá solo aproximadamente) en 
to,..., Ín. Si existe una “tendencia lineal” en los datos f(to),..., f(tn), entonces se espera po- 
der aproximar los valores de f mediante una función de la forma Bọ + 81t. Si hay una “tenden- 
cia cuadrática” de los datos, podría intentarse una función con la estructura Bo + Bit + Bf. 
Esto se analizó en la sección 6.6, pero desde otro punto de vista. 

En algunos problemas estadísticos, es importante poder separar las tendencias lineal y 
cuadrática (y posiblemente cúbica o de mayor orden). Por ejemplo, suponga que unos inge- 
nieros están analizando el desempeño de un nuevo automóvil, y f(t) representa la distancia 
entre el vehículo (en el momento 1) y algún punto de referencia. Si el auto viaja a velocidad 
constante, entonces la gráfica de f(t) debería ser una recta cuya pendiente es la velocidad del 
auto. Si se presiona el acelerador repentinamente, entonces la gráfica de f(t) cambiará para in- 
cluir un término cuadrático y posiblemente un término cúbico (debido a la aceleración). Para 
analizar la capacidad del auto para rebasar a otro, por ejemplo, los ingenieros tal vez quieran 
separar las componentes cuadrática y cúbica del término lineal. 

Si la función es aproximada por una curva de la forma y = Bo + Bıt + BÊ, es posi- 
ble que el coeficiente 8? no brinde la información deseada sobre la tendencia cuadrática en 
los datos, porque quizá no sea “independiente” (en un sentido estadístico) de los otros Bj. 
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FIGURA 2 
Aproximación por una función 
de tendencia cuadrática. 


Para efectuar el análisis de tendencia de los datos, se introduce un producto interior sobre el 
espacio P, análogo al del ejemplo 2 de la sección 6.7. Para p, q en P,,, se define 


(p,q) = plo) (to) + +++ + p(tn)q (tn) 


En la práctica, los especialistas en estadística rara vez necesitan considerar tendencias en 
los datos de grado mayor a tres o cuatro. Así que sean po, pi, p2, p3 una base ortogonal del 
subespacio [Pz de [P,,, obtenida al aplicar el proceso de Gram-Schmidt a los polinomios 1, t, 
P y $. De acuerdo con el ejercicio complementario 11 del capítulo 2, existe un polinomio g 
en P,, cuyos valores en tp,..., f, coinciden con aquellos de la función desconocida f. Sea £ la 
proyección ortogonal (con respecto al producto interior dado) de g sobre Pz, digamos, 


Ê = copo + C1P1 +C2P2 +C3P3 


Entonces ê se llama una función de tendencia cúbica, y co,..., c3 son los coeficientes de 
tendencia de los datos. El coeficiente cı mide la tendencia lineal, c2 la tendencia cuadrática, 
y c3 la tendencia cúbica. Resulta que si los datos tienen ciertas propiedades, entonces esos 
coeficientes son estadísticamente independientes. 

Como po,..., p3 son ortogonales, los coeficientes de tendencia se pueden calcular uno 
por uno, independientemente de los otros. (Recuerde que c; = (g, pi)/(pi, pi)). Es posible 
ignorar p3 y c3 si solo se desea la tendencia cuadrática. Y si, por ejemplo, se necesita deter- 
minar la tendencia cuártica, solo se tendría que encontrar (por medio de Gram-Schmidt) un 
polinomio pa en [Pa ortogonal a [Pz y calcular (g, pa) /(pa, pa). 


EJEMPLO 2 El uso más sencillo y común del análisis de tendencia ocurre cuando los 
puntos to,..., ty se pueden ajustar para quedar equidistantes entre sí y su suma sea cero. Ajuste 
una función de tendencia cuadrática a los datos (—2, 3), (— 1, 5), (0, 5), (1, 4) y Q, 3). 


SOLUCIÓN Las coordenadas / se escalan convenientemente para emplear los polinomios 
ortogonales encontrados en el ejemplo 5 de la sección 6.7: 


Polinomio: Po pı p2 Datos: g 


1 —2 2 3 
1 —1 —1 5 
Vector de valores: | 1 |, 0 |, —2 |, 5 
1 1 —1 4 
1 2 2 3 


Los cálculos solo necesitan esos vectores, y no las fórmulas específicas para los polinomios or- 
togonales. La mejor aproximación a los datos mediante polinomios en P, es la proyección 
ortogonal dada por 





a (g: po) (g, p1) (g, p2) 
P Po + Prit P2 
(po, Po) (pi; pi) (p2, p2) 


20 1 7 
5 Po — oP! 7 34P2 


PE) = 4- .1t —.5((? —2) (3) 


Como el coeficiente de pz no es extremadamente pequeño, sería razonable concluir que la 
tendencia es al menos cuadrática. Esto se confirma con la gráfica de la figura 2. E 
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Serie de Fourier (se requiere cálculo) 


Con frecuencia, las funciones continuas se aproximan mediante combinaciones lineales de 
funciones seno y coseno. Por ejemplo, una función continua podría representar una onda so- 
nora, una señal eléctrica del algún tipo, o el movimiento de un sistema mecánico vibratorio. 

Para simplificar, considere funciones en O = £ < 277. Resulta que cualquier función en 
C[O0, 277] se puede aproximar tan cerca como se requiera con una función de la forma 


a 
3 +a cost + += + ap cos nt + bi sen t+ = + bn sen nt (4) 


para un valor de n suficientemente grande. La función (4) es un polinomio trigonométrico. 
Si a, y b, no son ambas cero, entonces el polinomio es de orden n. La conexión entre polino- 
mios trigonométricos y otras funciones en C[0, 277] depende del hecho de que para cualquier 
n = 1, el conjunto 


[ 1, cos £, cos 2f,..., cos nt, sen £, sen 2£,..., sen nt) (5) 


sea ortogonal con respecto al producto interior 
271 
£9=) FO0g() di (6) 
0 
Esta ortogonalidad se comprueba como en el siguiente ejemplo y en los ejercicios 5 y 6. 


EJEMPLO 3 Considere que C[O, 271] tiene el producto interior (6), y sean m y n enteros 
positivos diferentes. Demuestre que cos mt y cos nt son ortogonales. 


SOLUCIÓN Utilice una identidad trigonométrica. Cuando m + n, 


2717 
(cos mt, cos nt) =/ cosmitcosnt dt 
0 


1 271 
= J [cos(mt + nt) + cos(mt — nt)] dt 
0 





2 
1 t+nt t= nt) ]|” 

= sen(mít + nt) ¿Sena nt) 0 a 
2 m+n m-n 0 





Sea W el subespacio de C[0, 271] generado por las funciones de la ecuación (5). Dada 
f en C[O, 275], la mejor aproximación a f mediante funciones en W es la aproximación 
de Fourier de n-ésimo orden sobre [0, 277]. Puesto que las funciones de la ecuación (5) 
son ortogonales, la mejor aproximación está dada por la proyección ortogonal sobre W. 
En este caso, los coeficientes az y b; de la ecuación (4) son los coeficientes de Fourier de f. 
La fórmula estándar para una proyección ortogonal indica que 


(f cos kt) b (f, sen kt} 


4 {cos kt, cos kt)’ Er (sen kt, sen kt) 


En el ejercicio 7 se le pide demostrar que (cos kt, cos kt} = m y (sen kt, sen kt} = m. Así, 


1 27 1 211 
ak =— | f(O)cosktdt, bi=— |] f(t) senktdt (7) 
T Jo T Jo 


El coeficiente de la función (constante) 1 en la proyección ortogonal es 


(f1) 1 [7 LL pe do 
nal FO:-1dt = aS FO cos- ar | Ba 





donde ay está definida por (7) para k = 0. Esto explica por qué el término constante en (4) se 
escribe como ap/2. 


388 CAPÍTULO 6 Ortogonalidad y mínimos cuadrados 


EJEMPLO 4 Encuentre la aproximación de Fourier de n-ésimo orden a la función 
F(0) = t sobre el intervalo [0, 277]. 
271 
=m 
0 


! f ktdt efa kt + E kt 3 0 
dk = — COS = — | — COS — sen = 
E x |k k 


SOLUCIÓN Calcule 


1 
2 


2 2 xh 2 





1 1 [7 1 
Sa tdt | 


y para k > 0, empleando integración por partes, 


1 [7 ıı t ar 2 
bg = if t senkt dt = z [zz senke — £ coski | SeT 


Así, la aproximación de Fourier de n-ésimo orden a f(t) = t es 














2 2 
mT — 2 sen t — sen 2t sen 3f — + sen nt 
3 n 
La figura 3 muestra las aproximaciones de Fourier de tercer y cuarto órdenes a f. E 
y y 
2714 Y=1 214 Yy=1 
T+ T+ 
| | t | + t 
T 2m T 27 
a) Tercer orden b) Cuarto orden 


FIGURA 3 Aproximaciones de Fourier de la función f(1) = t. 


La norma de la diferencia entre f y una aproximación de Fourier es el error cuadrático 
medio de la aproximación. (El término medio se refiere al hecho de que la norma está de- 
terminada por una integral). Es posible demostrar que el error cuadrático medio se aproxima 
a cero conforme se incrementa el orden de la aproximación de Fourier. Por esa razón, es 
común escribir 


00 
ao 
t) = — + w t + bm t 
SĄ 2 ze cos m sen mt) 


Esta expresión para f(t) es la serie de Fourier para f sobre [0, 277]. El término a,,cos mt, por 
ejemplo, es la proyección de f sobre un subespacio unidimensional generado por cos mt. 


PROBLEMAS DE PRÁCTICA 


1. Sean qi(0) = 1, quít) = t y qxe) = 3% — 4. Compruebe que (q1, q, q3) es un conjunto 
ortogonal en C[—2, 2] con el producto interior del ejemplo 7 de la sección 6.7 (integra- 
ción de —2 a 2). 


2. Encuentre las aproximaciones de Fourier de primer y tercer órdenes a 


f = 3 — 2 sen t + 5 sen 2t — 6 cos 2t 


6.8 EJERCICIOS 


1. 


Encuentre la recta de mínimos cuadrados y = fp + Bix que 
mejor se ajuste a los datos (—2, 0), (— 1, 0), (0, 2), (1, 4) y 
(2, 4), suponiendo que el primero y el último de los puntos de 
datos son menos confiables. Pondérelos a la mitad en relación 
con los tres restantes puntos interiores. 


En un problema de mínimos cuadrados ponderados, suponga 
que 5 de 25 puntos de datos tienen una medición de y que es 
menos confiable que las demás, y en consecuencia se deben 
ponderar a la mitad en relación con los otros 20 puntos. Un mé- 
todo consiste en ponderar los 20 puntos por un factor de 1, y 
los otros 5 por un factor de $. Un segundo método consiste 
en ponderar los 20 puntos por un factor de 2, y los otros 5 por 
un factor de 1. ¿Estos dos métodos producen resultados dife- 
rentes? Explique su respuesta. 


Ajuste una función de tendencia cúbica a los datos del ejemplo 


: o efh; = 54317 

2. El polinomio cúbico ortogonal es p3(t) = ¿19— ¿t. 

Para realizar un análisis de tendencia de seis puntos de datos 
igualmente espaciados, se pueden emplear polinomios ortogo- 


nales con respecto a la evaluación en los puntos £ = —5, —3, 
—-1,1,3 y5. 
a) Demuestre que los primeros tres polinomios ortogonales 
son 
pMO=1 pO=t y O=; -7 


(El polinomio pz se escaló para que sus valores en los puntos 
de evaluación fueran enteros pequeños). 


b) Ajuste una función de tendencia cuadrática a los datos 
(—5, 1), (—3, 1), (—1, 4), (1, 4), (3, 6), (5, 8) 


En los ejercicios 5 a 14, el espacio es C[0, 27] con el producto 
interior (6). 


5. 
6. 


Demuestre que sen mt y sen nt son ortogonales cuando m + n. 


Demuestre que sen mt y cos nt son ortogonales para todos los 
enteros positivos m y n. 


Demuestre que ||cos kt||? = 7 y ||sen kt? para k > 0. 


Encuentre la aproximación de Fourier de tercer orden a 


fO=t-1. 


10. 


11. 


12. 


13. 


14. 


15. 


16. 
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. Obtenga la aproximación de Fourier de tercer orden a 
fO=2Tr-!t. 
Determine la aproximación de Fourier de tercer orden a la 


función de onda cuadrada, f(t) = 1 para0=<t<Ty f(0)=—1 
para T S t< 27. 


Encuentre la aproximación de Fourier de tercer orden a sen?z, 
sin efectuar cálculos con integrales. 


Obtenga la aproximación de Fourier de tercer orden a cos%, 
sin efectuar cálculos con integrales. 


Explique por qué un coeficiente de Fourier de la suma de dos 
funciones es la suma de los coeficientes de Fourier correspon- 
dientes de las dos funciones. 


Suponga que los primeros pocos coeficientes de Fourier de 
alguna función f en C[0, 27] son ao, a1, a2, y b1, b2, b3. ¿Cuál 
de los siguientes polinomios trigonométricos es más cercano 
a f? Argumente su respuesta. 


g) = > + a, cost + a, cos 21 + b, sen £ 


h(t) = > + a, cost + azcos 21 + bi sen t + bz sen 2t 


[M] Consulte los datos del ejercicio 13 de la sección 6.6, con- 
cernientes al despegue de un avión. Suponga que los errores de 
las posibles mediciones aumentan conforme se incrementa la 
rapidez del avión, y sea W la matriz ponderada diagonal cuyas 
entradas diagonales son 1, 1, 1, .9, .9, .8, .7, .6, .5, .4, .3, .2 y .1. 
Encuentre la curva cúbica que se ajuste a los datos con error de 
mínimos cuadrados ponderados, y úsela para estimar la velo- 
cidad del avión cuando £ = 4.5 segundos. 


[M] Sean fa y fs las aproximaciones de Fourier de cuarto y 
quinto órdenes en C[O, 271] a la función de onda cuadrada del 
ejercicio 10. Elabore gráficas separadas de f4 y fs en el inter- 
valo [0, 27], y trace una gráfica de f5 en [-2rr, 271]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Calcule 


a 1 
2 2 
2 

wa) = f 1: (B3 — 4) dt = (C — 4t) 
=2 


2 
(q2,43) = fs (3 — 4) dt = 


2 





—2 








2. La aproximación de Fourier de tercer orden a fes la mejor aproximación en C[0, 2w] a f 
mediante funciones (vectores) en el subespacio generado por 1, cos t, cos 2t, cos 3f, sen t, 
sen 21 y sen 3t. Pero f está evidentemente en este subespacio, así que fes su propia mejor 


L f = 3 — 2 sen t + 5 sen 2t — 6 cos 2t 
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y 
y=3-2sent 
g y=£0) 
aa aproximación: 
3 z 
T 
— AA 1 
34 2m 





Para la aproximación de primer orden, la función más cercana a f en el subespacio 
W = Gen {1, cos £, sen 1] es 3 — 2 sen £. Los otros dos términos en la fórmula para 
F(O son ortogonales a las funciones en W, así que no contribuyen a las integrales que 


dan los coeficientes de Fourier para la aproximación de primer orden. 


Aproximaciones de primer y tercer 


órde 


nes a f(t). 


CAPÍTULO 6 EJERCICIOS COMPLEMENTARIOS 


1. 


Los siguientes enunciados se refieren a vectores en R” (o R”) 
con el producto interior estándar. Marque cada enunciado como 
verdadero o falso. Justifique sus respuestas. 


a) La longitud de cada vector es un número positivo. 

b) Un vector v y su negativo — v tienen iguales longitudes. 
c) La distancia entre u y v es |u — vll. 

d) Si r es cualquier escalar, entonces [|rv]| = r||v]|. 


e) Si dos vectores son ortogonales, entonces son linealmente 
independientes. 


f) Si x es ortogonal a u y v, entonces x debe ser ortogonal a 
u — y. 

8) Silu + vi? = lul? + liv 

h) Silla — v|? = lal? + liv 

i) La proyección ortogonal de y sobre u es un múltiplo escalar 
de y. 





?, entonces u y v son ortogonales. 





P, entonces u y v son ortogonales. 


j) Si un vector y coincide con su proyección ortogonal sobre 
un subespacio W, entonces y está en W. 


k) El conjunto de todos los vectores en R” ortogonales a un 
vector fijo es un subespacio de R”. 


1) Si W es un subespacio de R”, entonces W y W+ no tienen 
vectores en común. 

m) Si [v1, vaz, V3} es un conjunto ortogonal y si c1, C2 Y C3 
son escalares, entonces {C1V1, C2V2, C3V3} es un conjunto 
ortogonal. 


n) Si una matriz U tiene columnas ortonormales, entonces 
UUT =]. 

o) Una matriz cuadrada con columnas ortogonales es una ma- 
triz ortogonal. 


p) Si una matriz cuadrada tiene columnas ortonormales, enton- 
ces también tiene filas ortonormales. 


q) Si W es un subespacio, entonces ||proyw v|? + |v 
proyw v|? = |v? 


r) Una solución de mínimos cuadrados de Ax = b es el vector 
AX en Col A más cercano a b, de manera que lb — AX]|| = 
Ib — AX] para toda x. 


s) Las ecuaciones normales para una solución de mínimos cua- 
drados de Ax = b están dadas por £ = (474)! A7b. 


Sea {v1,..., Vp} un conjunto ortonormal. Compruebe la si- 
guiente igualdad mediante inducción, iniciando con p = 2. 
Si x = C¡V¡ + *** + CpVp, entonces 


Ixl? = lci? +-+ + lcpl? 


Sea {v1,..., Vp} un conjunto ortonormal en R”. Compruebe la 
siguiente desigualdad de Bessel, que es válida para toda x en 
R”: 


lx? > (xvi? + [x= vo? + +++ [xv]? 


Sea U una matriz ortogonal de n x n. Demuestre que si 
[vi,..., vn) es una base ortonormal para R”, entonces también 
lo es {Uv1,..., UVn}. 


Demuestre que si una matriz U de n x n satisface (Ux): 
(Uy) = x-y para todas las x y y en R”, entonces U es una ma- 
triz ortogonal. 


Demuestre que si U es una matriz ortogonal, entonces cualquier 
valor propio real de U debe ser +1. 


Una matriz de Householder, o un reflector elemental, tiene la 
forma O = 1 — 2uu”, donde u es un vector unitario. (Véase 
el ejercicio 13 en los ejercicios complementarios del capítulo 
2). Demuestre que O es una matriz ortogonal. (Los reflectores 
elementales se utilizan a menudo en programas computaciona- 
les para construir una factorización QR de una matriz A. Si A 
tiene columnas linealmente independientes, entonces la multi- 
plicación por la izquierda mediante una secuencia de reflectores 
elementales puede generar una matriz triangular superior). 


9. 


10. 


11. 


12. 


13. 


14. 


Sea T : R” — R” una transformación lineal que preserva lon- 
gitudes; es decir, |T|] = ||x|| para toda x en R”. 








a) Demuestre que T también preserva ortogonalidad; es decir, 
T(x)'T(y)= 0 siempre que x-y = 0. 

b) Demuestre que la matriz estándar de T es una matriz orto- 
gonal. 


Considere que u y v representan vectores linealmente inde- 
pendientes en R” que no son ortogonales. Describa cómo en- 
contrar la mejor aproximación a z en R” mediante vectores de 
la forma x¡u + x2v sin construir primero una base ortogonal 
para Gen (u, v). 





Suponga que las columnas de A son linealmente independien- 
tes. Determine qué pasa con la solución de mínimos cuadrados 
X de Ax = b cuando b se remplaza por cb para algún escalar c 
diferente de cero. 


Si a, b y c son números distintos, entonces el siguiente sistema 
es inconsistente porque las gráficas de las ecuaciones son planos 
paralelos. Demuestre que el conjunto de todas las soluciones de 
mínimos cuadrados del sistema es precisamente el plano cuya 
ecuación es x — 2y + 52 = (a + b + c)/3. 


x=2y+5z=a 
x—2y+5z=b 
x—2y+5z=c 


Considere el problema de encontrar un valor propio de una ma- 
triz A den x n cuando se conoce un vector propio v aproximado. 
Puesto que v no es exactamente correcto, la ecuación 


Av = Av (1) 


probablemente no tendrá una solución. Sin embargo, À se puede 
estimar mediante una solución de mínimos cuadrados cuando 
la ecuación (1) se analiza adecuadamente. Piense en v como en 
una matriz V de n x 1, y considere A un vector en R!, y denote el 
vector Av con el símbolo b. Luego, (1) se reduce a b = AV, que 
también se puede escribir como VA = b. Obtenga la solución de 
mínimos cuadrados de este sistema de n ecuaciones con la única 
incógnita A, y escriba esta solución empleando los símbolos ori- 
ginales. La estimación resultante para A se denomina cociente 
de Rayleigh. Véase los ejercicios 11 y 12 de la sección 5.8. 


Siga los pasos descritos a continuación para probar las siguien- 
tes relaciones entre los cuatro subespacios fundamentales deter- 
minados por una matriz A de m x n. 


Fil A = (Nul A)+, Col A = (Nul A7)+ 


a) Demuestre que Fil A está contenida en (Nul A)+. (Demues- 
tre que si x está en Fil A, entonces x es ortogonal a cada u 
en Nul A). 


b) Suponga que rango A = r. Encuentre dim Nul A y dim (Nul 
A)”, y entonces deduzca del inciso a) que Fil A = (Nul A)+. 
[Sugerencia: Estudie los ejercicios de la sección 6.3]. 


c) Explique por qué Col A = (Nul A)+. 
Explique por qué una ecuación Ax = b tiene una solución si 


y solo si b es ortogonal a todas las soluciones de la ecuación 
ATx =0. 
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Los ejercicios 15 y 16 conciernen a la factorización de Schur (real) 
de una matriz A de n x n en la forma A = URUT, donde U es una 
matriz ortogonal y R es una matriz triangular superior de n x n.! 


15. Demuestre que si A admite una factorización de Schur (real), 
A = URU”, entonces A tiene n valores propios reales, contando 
multiplicidades. 


16. Sea A una matriz de n x n con n valores propios reales, contando 
multiplicidades, denotados con À1,..., Àn. Es posible demostrar 
que A admite una factorización de Schur (real). Los incisos a) 
y b) dan las ideas clave de la demostración. El resto de la de- 
mostración equivale a repetir a) y b) para matrices sucesivamen- 
te más pequeñas, y luego unir todos los resultados. 


a) Sean u; un vector propio unitario correspondiente a Àı, 
y W2,..., Un Cualesquiera otros vectores tales que {u;,..., 
u,) sea una base ortonormal para R”, y entonces sea U = 
[u] u -** u,]. Demuestre que la primera columna de UT 
AU es àe, donde e; es la primera columna de la matriz 
identidad de n x n. 


b 


© 


El inciso a) implica que UTAU tiene la forma que se mues- 
tra abajo. Explique por qué los valores propios de A, son 
A2,..., An. [Sugerencia: Véase los ejercicios complementa- 
rios del capítulo 5]. 


Ài * * * * 
7 | 


i Aj | 
0 


[M] Cuando el lado derecho de una ecuación Ax = b se modifica 
ligeramente, por ejemplo, a Ax = b + Ab para algún vector Ab, 
la solución cambia de x a x + Ax, donde Ax satisface A(Ax) = Ab. 
El cociente [|Ab]|/|Ib]| es el cambio relativo en b (o el error relativo 
en b cuando Ab representa el error posible en las entradas de b). 
El cambio relativo en la solución es [|Ax]|/[|x[|. Cuando A es invertible, 
el número de condición de A, representado como cond(A), aporta 
un límite de la magnitud del cambio relativo en x: 


UTAU = 


Ax] AD] 
YT < cond(A)- > 2) 
ixl] libl| 


En los ejercicios 17 a 20, resuelva Ax = b y A(Ax) = Ab, y de- 
muestre que la desigualdad (2) es válida en cada caso. (Véase el 


análisis de matrices mal condicionadas en los ejercicios 41 a 43 de 
la sección 2.3). 


4.5 31 19.249 .001 
1 he ri e= | ogas | Ab a iR 


4.5 31 .500 
a a a pe= Dania 


II 
E. 
J . 
eo 
oo 
WU = 
R] 


1 Si se permiten números complejos, cada matriz A de n x n admite una fac- 
torización de Schur (compleja), A = URU™!, donde R es triangular supe- 
rior y U`! es la transpuesta conjugada de U. Este hecho de gran utilidad se 
analiza en la obra Matrix Analysis, de Roger A. Horn y Charles R. Johnson 
(Cambridge: Cambridge University Press, 1985), pp.79-100. 
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7 —6 —4 1 .100 7 —6 -4 1 4.230 
mao 7 Om los mA To n 7 23 |P= | Toor | 
19 9 7 1 1.462 19 9 c] 1 69.536 

.49 27 

ab = 107 "57 Ab= 10| 377 


8.04 3.93 





( 


Matrices simétricas y 
formas cuadráticas 


EJEMPLO INTRODUCTORIO 


Procesamiento de imágenes 
multicanal 


Alrededor del mundo, en poco más de 80 minutos, los dos 
satélites Landsat cruzan silenciosamente el firmamento en 
órbitas casi polares, grabando imágenes del terreno y las 
líneas costeras, en franjas de 185 kilómetros de ancho. 
Luego de 16 días, cada satélite habrá transitado por encima 
de casi todos los kilómetros cuadrados de la superficie de la 
Tierra, de manera que cualquier zona se puede monitorizar 
cada ocho días. 


Las imágenes Landsat son útiles para muchos objetivos. 
Los diseñadores y planificadores urbanos las utilizan para 
estudiar la rapidez y dirección del crecimiento urbano, el 
desarrollo industrial y otros cambios en el uso del suelo. 
Esas imágenes permiten analizar la humedad del suelo en las 
zonas rurales, clasificar la vegetación de regiones remotas, 
y localizar arroyos y lagos tierra adentro. Los gobiernos 
pueden detectar y evaluar los daños de desastres naturales, 
como incendios forestales, flujos de lava, inundaciones y 
huracanes. Las agencias de protección ambiental pueden 
identificar contaminación por emisiones de humo y medir 
la temperatura del agua en lagos y ríos cerca de plantas 


de energía. 


Los sensores satelitales toman siete imágenes 
simultáneas de cada región del suelo que se va a estudiar. 
Los sensores registran energía de bandas de longitud de onda 
separadas: tres en el espectro de luz visible y cuatro en las 
bandas infrarroja y térmica. Cada imagen se digitaliza y se 
almacena como un arreglo rectangular de números, donde 





cada número indica la intensidad de la señal en un punto 
pequeño (o pixel) correspondiente en la imagen. Cada una 
de las siete imágenes es un canal de una imagen multicanal 


o multiespectral. 


Las siete imágenes Landsat de una región fija, por lo 
general, contienen mucha información redundante, ya que 
algunos aspectos aparecen en varias imágenes. Sin embargo, 
otros aspectos, por su color o temperatura, reflejan luz que 
solo se registra en uno o dos de los sensores. Un objetivo 
del procesamiento de imágenes multiespectrales es el de 
visualizar los datos en una forma que permita extraer 
información de mejor calidad que cuando se estudia cada 
imagen por separado. 


El análisis de componentes principales es una manera 
eficaz de suprimir información redundante y concentrar, en 
tan solo una o dos imágenes compuestas, la mayor parte de 
la información de los datos iniciales. A grandes rasgos, el 
objetivo es encontrar una combinación lineal especial de 
las imágenes, es decir, una lista de pesos que en cada pixel 
combinen los siete valores correspondientes de las imágenes 
en un nuevo valor. Los pesos se eligen de manera que 
permitan ampliar, en comparación con cualquiera de las 
imágenes originales, el rango de las intensidades de luz 
(la varianza de la escena) en la imagen compuesta (llamada 
la primera componente principal). También es posible 
obtener imágenes adicionales de componentes, mediante 
un criterio que se explicará en la sección 7.5. 
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En las fotografías tomadas sobre el Valle Railroad, 
Nevada, que se muestran a continuación se ilustra el análisis 
de componentes principales. En las fotografías a), b) y c) se 
observan imágenes de tres bandas espectrales Landsat. La 
información total en las tres bandas se reacomoda en las tres 
imágenes de componentes principales en las fotografías d), 
e) y f). La primera componente d) presenta (o “explica”, 
el 93.5% de la varianza de la escena presente en los datos 
iniciales. De esta forma, los datos iniciales de tres canales 


se reducen a datos de un canal, con un pérdida (en algún 
sentido) de solo el 6.5% de la varianza de la escena. 

La empresa Earth Satellite Corporation, en Rockville, 
Maryland, que amablemente proporcionó las fotos que aquí 
se incluyen, está experimentando con imágenes de 224 
bandas espectrales separadas. El análisis de componentes 
principales, esencial para esos conjuntos enormes de datos, 
por lo general reduce los datos a unas 15 componentes 
principales utilizables. 





d) Componente principal 1: 93.5%. e) Componente principal 2: 5.3%. f) Componente principal 3: 1.2%. 


En las aplicaciones, las matrices simétricas surgen, de una u otra manera, con mayor frecuen- 
cia que cualquier otra clase de matrices. La teoría es bella y rica, dependiendo en esencia 
de la diagonalización y la ortogonalidad, temas que se estudiaron en los capítulos 5 y 6, 
respectivamente. La diagonalización de una matriz simétrica, descrita en la sección 7.1, es el 
fundamento del análisis en las secciones 7.2 y 7.3 concernientes a formas cuadráticas. A la 
vez, la sección 7.3 es necesaria para las dos últimas secciones referentes a la descomposición 
en valores singulares y al procesamiento de imágenes descrito en el ejemplo introductorio. 
En este capítulo todos los vectores y las matrices tienen entradas reales. 
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7.1. DIAGONALIZACIÓN DE MATRICES SIMÉTRICAS 


TEOREMA 1 


Una matriz simétrica es una matriz A tal que A7 = A. Esta matriz es necesariamente cuadra- 
da. Sus entradas en la diagonal principal son arbitrarias, pero sus otras entradas se presentan 
por pares, en lados opuestos de la diagonal principal. 


EJEMPLO 1 De las siguientes matrices, solo las primeras tres son simétricas: 


1 o0 0-1 0 a b c 
Simétricas: | oO - | -1 5 81, b d e 
0 8 -7 c e f 
13 1-4 0 5 4 3 2 
No simétricas: | 3 a —6 1 —4 J, 43. 2 1 a 
0 —6 1 32 1.0 


Para comenzar el estudio de matrices simétricas, es útil revisar el proceso de diagonali- 
zación de la sección 5.3. 


6 -2 -l1 
EJEMPLO 2 Sies posible, diagonalice la matriz A = | —2 6 —1 
-1 -1 5 


SOLUCIÓN La ecuación característica de A es 
0 = —1° + 174°? — 90A + 144 = —(A — 8)NA — 6)(A — 3) 

Los cálculos estándar producen una base para cada espacio propio: 

-1 —-1 


2 


A=8: A=3: v3= 


v = 


Estos tres vectores conforman una base para R?. De hecho, es fácil comprobar que {v1, V2, V3} 
es una base ortogonal de R?. La experiencia del capítulo 6 sugiere que una base ortonormal 
sería útil en los cálculos, así que a continuación se presentan los vectores propios normaliza- 
dos a uno: 


1/46 1/43 


1/43 


1/42 


u = 1/42 |, wm=|-1/V6 |, u= 
0 2/46 1/43 
Sean 
-1/V42 -1/46 1/43 8 0 0 
P=| 1/42 -1/46 1/43|, D=|0 6 0 
0 2/V6 1/43 0. 0 3 


Entonces A = PDP”7!, como es usual. Pero esta vez, como P es cuadrada y tiene columnas 
ortonormales, resulta que P es una matriz ortogonal, y P7! es simplemente P”. (Véase la 
sección 6.2). E 


El teorema 1 explica por qué los vectores propios del ejemplo 2 son ortogonales, ya que 
corresponden a distintos valores propios. 


Si A es simétrica, entonces dos vectores propios cualesquiera de diferentes espacios 
propios son ortogonales. 
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TEOREMA 2 


DEMOSTRACIÓN Sean vi y va los vectores propios asociados a los valores propios diferen- 
tes A y A. Para demostrar que vı + v2 = 0, calcule 


21v1+ va = (Aviv, = (Avi) v2 Puesto que v; es un vector propio 
= (v! AT)v = vw (Ava) Debido a que A” =A 
= v? (A2v2) Porque va es un vector propio 


= dav va = A2v1- V2 
Por lo tanto, (A; — A2)v1 © V2 = 0. Pero (A; — A2) F O, así que vı : v2 = O. E 


El tipo especial de diagonalización del ejemplo 2 es crucial para la teoría de matrices 
simétricas. Se dice que una matriz A de n x n es diagonalizable ortogonalmente si existen 
una matriz ortogonal P (con P7! = P”) y una matriz diagonal D tales que 


A=PDP* = PDP”' í) 


Esta diagonalización requiere n vectores propios ortonormales linealmente indepen- 
dientes. ¿Cuándo es posible esto? Si A es diagonalizable ortogonalmente como en la ecua- 
ción (1), entonces 


A7 = (PDP) = PT DTP" = PDP" = A 


Por lo tanto, ¡A es simétrica! El teorema 2 que se presenta a continuación, muestra que, a 
la inversa, cada matriz simétrica es diagonalizable ortogonalmente. La demostración es mu- 
cho más difícil y se omite; la idea principal para la demostración se presentará después del 
teorema 3. 


Una matriz A de n x n es diagonalizable ortogonalmente si y solo si A es una matriz 
simétrica. 


Este teorema es sorprendente, ya que el trabajo realizado en el capítulo 5 sugeriría que 
es prácticamente imposible decir cuándo una matriz es diagonalizable. Pero este no es el caso 
para las matrices simétricas. 

El siguiente ejemplo se refiere a una matriz cuyos valores propios no son todos dis- 
tintos. 


3-2 4 
EJEMPLO 3  Diagonalice ortogonalmente la matriz A=| -2 6 2 |, cuya ecua- 
4 2 3 


ción característica es 
0 = —1? + 122? — 211 — 98 = (4 -— DA +2) 


SOLUCIÓN Los cálculos usuales producen bases para los espacios propios: 


1 —1/2 —1 
A=T:v1=|0|,vw= de à = —2: v; = | —1/2 
1 0 1 


Aunque vı y v2 son linealmente independientes, no son ortogonales. Recuerde de la sec- 





yo -2 V2° V] 
ción 6.2 que la proyección de vz sobre vı es vı, y que la componente de va ortogonal 
Vi. Vi 
a vı es 


Dei LEE -1/4 
Z2 =V2— vı = 1 — —— | 0 = 1 
Yii 0 2 |i 1/4 





TEOREMA 3 
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Entonces (v;¡, zz) es un conjunto ortogonal en el espacio propio para A = 7. (Observe que 
z, es una combinación lineal de los vectores propios v, y va, así que z» está en el espacio 
propio. Esta construcción de z, es justamente el proceso de Gram-Schmidt de la sección 6.4). 
Como el espacio propio tiene dos dimensiones (con la base v;, v2), el conjunto ortogonal 
{V1, Z2} es una base ortogonal para el espacio propio, de acuerdo con el teorema de la base. 
(Véase la sección 2.9 o la 4.5). 

Al normalizar v¡ y z2 se obtiene la siguiente base ortonormal del espacio propio para 
A=7: 


1/42 —1/V18 
0 , U= 4/18 
1/42 1/ V18 


u; = 


Una base ortonormal del espacio propio para A = —2 es 


—2 -2/3 

1 1 
u = ——— 2y; = -| —1 | = | —1/3 
[2v3 || 3 2 2/3 


De acuerdo con el teorema 1, uz es ortogonal a los vectores propios u; y u2. Por lo tanto, 
{u;, u2, U3} es un conjunto ortonormal. Sean 


1/42 -1/V18 -2/3 7 0 0 
P=[u u u]= 0 4/418 —1/3|, D=|0 7 0 
1/42  1/V18 2/3 0 0-2 

Entonces P diagonaliza ortogonalmente a A, y aA = PDP”?. E 


En el ejemplo 3, el valor propio 7 tiene multiplicidad dos y el espacio propio es bidimen- 
sional. Este hecho no es fortuito, como lo muestra el siguiente teorema. 


Teorema espectral 


Algunas veces el conjunto de valores propios de una matriz A se denomina el espectro de A, y 
la siguiente descripción de los valores propios se conoce como teorema espectral. 


Teorema espectral para matrices simétricas 


Una matriz simétrica A de n x n tiene las siguientes propiedades: 


a) A tiene n valores propios reales, contando las multiplicidades. 

b) La dimensión del espacio propio para cada valor propio À es igual a la multiplicidad 
de A como una raíz de la ecuación característica. 

c) Los espacios propios son mutuamente ortogonales, en el sentido de que los vectores 
propios correspondientes a diferentes valores propios son ortogonales. 


d) Aes diagonalizable ortogonalmente. 


El inciso a) se deduce del ejercicio 24 de la sección 5.5. El inciso b) se deduce fácilmente 
del inciso d). (Véase el ejercicio 31). El inciso c) es el teorema 1. A partir del inciso a), puede 
hacerse una demostración para d) utilizando el ejercicio 32 y la factorización de Schur anali- 
zada en el ejercicio complementario 16 del capítulo 6. Se omiten los detalles. 
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Descomposición espectral 


Suponga que A = PDP”!, donde las columnas de P son los vectores propios ortonormales 
u;,..., U, de A, y los valores propios correspondientes Aj,..., A, están en la matriz diagonal D. 
Entonces, como P~! = PT, 


Ài 0 ul 
A=PDP =|u -> w] : 
0 An ul 
uj 
=[ Au «+ Anun ]] : 
u? 


Utilizando la expansión columna-fila de un producto (teorema 10 de la sección 2.4), se puede 
escribir 


AES Auju? + Muu? + + Apu u? (2) 


A esta representación de A se le llama descomposición espectral de A porque la di- 
vide en partes determinadas por su espectro (valores propios). Cada término en (2) es una 
matriz de n x n de rango 1. Por ejemplo, cada columna de Auu? es un múltiplo de u;. 
Además, cada matriz uju es una matriz de proyección en el sentido de que para cada x 
en R”, el vector (uu; )x es la proyección ortogonal de x sobre el subespacio generado por uj. 
(Véase el ejercicio 35). 


EJEMPLO 4 Construya una descomposición espectral de la matriz A que tiene la diago- 
nalización ortogonal 


E RASAR MA A 


SOLUCIÓN Denote las columnas de P como u; y u2. Entonces, 
A=8uju/ + 3u7u5 


Para comprobar esta descomposición de A, calcule 


[jes rs dh] 


era[n ase 


[32/5 16/5 ae Sosia 2i 
smu + 3wa = | 10 lea pelei IE e 


7.1 EJERCICIOS 


En los ejercicios 1 a 6, determine cuáles matrices son simétricas. 





7.1 Diagonalización de matrices simétricas 399 


NOTA NUMÉRICA 


Cuando A es simétrica y no demasiado grande, los modernos algoritmos computacio- 
nales de gran desempeño calculan valores propios y vectores propios con gran preci- 
sión. Aplican una secuencia de transformaciones de semejanza sobre A que implican 
matrices ortogonales. Las entradas diagonales de las matrices transformadas conver- 
gen rápidamente a los valores propios de A. (Véase las notas numéricas de la sección 
5.2). Por lo general, el empleo de matrices ortogonales evita el acumulamiento de erro- 
res numéricos durante el proceso. Cuando A es simétrica, la secuencia de matrices 


ortogonales se combina para formar una matriz ortogonal cuyas columnas son vecto- 
res propios de A. 

Una matriz no simétrica no puede tener un conjunto completo de vectores propios 
ortogonales, pero el algoritmo continuará produciendo valores propios más o menos 
exactos. Después de eso, se requieren técnicas no ortogonales para calcular los vec- 
tores propios. 


PROBLEMAS DE PRÁCTICA 


1. Demuestre que si A es una matriz simétrica, entonces A? también es simétrica. 


2. Demuestre que si A es diagonalizable ortogonalmente, entonces A? también lo es. 


i 3 5 2 [> 3 5 (22) 2, 0. 
Sse -5 3 
3 1 lo 5 
13. 14. 
e 0 8 3 1 3 5 1 
A E d A : a a 15. [ 16 4 16 [7 2 
E "o |-4 1 | 24 7 
n A 1 1 3 2 —36 0 
5. 0-6 2 A Ll ¿2 a PS 
0 0 6 6 2 1 2 17. | 1 1 18. | -36 -23 0 
3 1 1 0 0 3 
En los ejercicios 7 a 12, determine qué matrices son ortogonales. Si 3: a i 7-4 4 
alguna es ortogonal, encuentre su inversa. 19. |2 6 2 20. |-4 5 0 
4 2 3 4 0 9 
E: 1/42 -1/42 
" |.8 —.6 1/42 1/72 4 1 3 1 2 0 0 0 
1 4 1 3 0 1 0 1 
ea IO Alas de dd EAS E 50 
a 5 Mr a I 3 1 4 0 1 0 1 
2 2 -1 
2/3 2/3 1/3 3 1 
11. 0 1/ V5 AS 23. Sean A=|1 3 y v= | 1 |. Compruebe que 2 es 
5/3 -4/V45 -2/v/45 1 1l 
BO as un valor propio de A y v un vector propio. Después, diagonalice 
A A E A ortogonalmente. 
12. 5 5 5 iS 
z ` A : 5 —4 -2 —2 1 
-5 5 5 5 24. Sean A= | —4 5 2 |,v= 2 y vw=|l 
2. 2 2 1 0 


En los ejercicios 13 a 22, diagonalice ortogonalmente las matri- 


ces, dando una matriz ortogonal P y una matriz diagonal D. Para 
ahorrarle tiempo, los valores propios en los ejercicios 17 a 22 son: 


gonalice A ortogonalmente. 


(17) 5, 2, —2; (18) 25, 3, —50; (19) 7, —2; (20) 13, 7, 1; (21) 9, 5, 1; 


Compruebe que v; y v2 son vectores propios de A. Después dia- 
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En los ejercicios 25 y 26, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


25. a) Una matriz de n x n que es diagonalizable ortogonalmente 
debe ser simétrica. 
b) Si AT = A y si los vectores u y v satisfacen Au = 3u y 
Av = 4y, entonces u-v = 0. 
c) Una matriz simétrica de n x n tiene n valores propios reales 
distintos. 
d) Para v diferente de cero en R”, la matriz vv? es una matriz 
de proyección. 
26. a) Cada matriz simétrica es diagonalizable ortogonalmente. 
b) Si B = PDP", donde P7 = P”! y D es una matriz diagonal, 
entonces B es una matriz simétrica. 
c) Una matriz ortogonal es diagonalizable ortogonalmente. 


d) La dimensión de un espacio propio de una matriz simétrica 
es igual a la multiplicidad del valor propio correspondiente. 


27. Suponga que A es una matriz simétrica de n x n, y B es cual- 
quier matriz de n x m. Demuestre que BTAB, BTB y BB” son 
matrices simétricas. 


28. Demuestre que si A es una matriz simétrica de n x n, entonces 
(Ax):y = x:(Ay) para toda x, y en R”. 


29. Suponga que A es invertible y diagonalizable ortogonalmen- 
te. Explique por qué A”! también es diagonalizable ortogonal- 
mente. 


30. Suponga que tanto A como B son diagonalizables ortogonal- 
mente y que AB = BA. Explique por qué AB también es diago- 
nalizable ortogonalmente. 


31. Sean A = PDP”!, donde P es ortogonal y D es diagonal, y A es 
un valor propio de A de multiplicidad k. Entonces A se presenta 
k veces sobre la diagonal de D. Explique por qué la dimensión 
del espacio propio para A es k. 


32. Suponga que A = PRP”!, donde P es ortogonal y R es trian- 
gular superior. Demuestre que si A es simétrica, entonces R es 
simétrica y, por lo tanto, realmente es una matriz diagonal. 


33. Construya una descomposición espectral de A del ejemplo 2. 
34. Construya una descomposición espectral de A del ejemplo 3. 


35. Sea u el vector unitario en R”, y sea B = uu”. 


a) Dada cualquier x en R”, calcule Bx y demuestre que Bx es 
la proyección ortogonal de x sobre u, como se describió 
en la sección 6.2. 


b) Demuestre que B es una matriz simétrica y que B? = B. 


c) Demuestre que u es un vector propio de B. ¿Cuál es el valor 
propio correspondiente? 


36. Sea B una matriz simétrica de n x n tal que B? = B. Cual- 
quier matriz de este tipo se conoce como matriz de proyección 
(o matriz de proyección ortogonal). Para cualquier y en R”, 
sean ŷ = Byyz=y-—-ĵ. 
a) Demuestre que z es ortogonal a $. 


b) Sea W el espacio columna de B. Demuestre que y es la suma 
de un vector en W y de un vector en W+. Por qué esto de- 
muestra que By es la proyección ortogonal de y sobre el 
espacio columna de B? 


[M] En los ejercicios 37 a 40, diagonalice ortogonalmente las ma- 
trices indicadas. Para practicar los métodos de esta sección, no utilice 
la rutina de vectores propios de su programa de matrices. En vez de 
ello, aplique el programa para encontrar los valores propios, y para 
cada valor propio À, obtenga una base ortonormal para Nul(A — AZ), 
como en los ejemplos 2 y 3. 


[5 2 9 —6 
Ze ZO 
9 


37. ra 
[=6 9 2 5 
[| .38 —.18 —.06 —.04 
—.18 .59 —.04 .12 
SN —.006 —.04 .47 —.12 
| —.04 .12 —.12  .41 


[.31 .58  .08 idl 

.58 —.56 .44 —.58 

aa: .08 .44 .19 —.08 
| -44 —.58 —.08 .31 


Pio 2 2 -6 9 
2 10 2 —6 i 

40. | 2 2 10 -6 9 

6 -6 -6 26 9 





SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. (427 = (AA)! = ATAT, por una propiedad de la transpuesta. Por hipótesis, A7 = A. Así 
que (4?)" = AA = A?, lo que demuestra que A? es simétrica. 


2. Si A es diagonalizable ortogonalmente, entonces A es simétrica de acuerdo con el teo- 
rema 2. Según el problema de práctica 1, A? es simétrica y, por lo tanto, es diagonalizable 
ortogonalmente (teorema 2). 


7.2 Formas cuadráticas 401 


7.2 FORMAS CUADRÁTICAS 


Hasta ahora en este libro nos hemos concentrado en ecuaciones lineales, excepto por la sumas 
de cuadrados que se encontraron en el capítulo 6 al calcular xx. Estas sumas y expresiones 
más generales, llamadas formas cuadráticas, se presentan con frecuencia en aplicaciones del 
álgebra lineal a la ingeniería (en criterios de diseño y optimización) y el procesamiento de 
señales (como potencia de ruido de salida). Las aplicaciones también surgen, por ejemplo, en 
física (como energías potencial y cinética), geometría diferencial (como la curvatura normal 
de superficies), economía (como funciones de utilidad) y estadística (en elipsoides de con- 
fianza). Parte de las bases matemáticas para dichas aplicaciones fluye fácilmente de nuestro 
trabajo de matrices simétricas. 

Una forma cuadrática en R” es una función Q definida sobre R” cuyo valor en un vec- 
tor x de [R” se puede calcular mediante una expresión de la forma O(x) = x”Ax, donde A es 
una matriz simétrica de n x n. La matriz A se denomina matriz de la forma cuadrática. 

El ejemplo más sencillo de una forma cuadrática diferente de cero es Q(x) = x"Ix = [Ix[]?. 
Los ejemplos 1 y 2 revelan la conexión entre cualquier matriz simétrica A y la forma cuadrá- 
tica x7Ax. 


EJEMPLO 1 Sea x = E | Calcule x7Ax para las siguientes matrices: 
2 


4 0 3 —2 
aA l baj ] 
SOLUCIÓN 
4 Olfx 4x 
T4% — HRS 1| 4,2 2 
a) xX'Ax = |x «115 Ao =r 03 | pon 


b) En A existen dos entradas —2. Observe cómo participan en los cálculos. La entrada (1, 2) 
en A está en negritas. 


Tae 3-2 |x| _ 3x1 — 2x2 
x'Ax =[|x al 3 7 x2 = [x x2] 2x1 + 7x2 


= x1(3x1 — 2x2) + x2(—2x1 + 7x2) 
= 3x? — 2x1 X2 — 2x9Xx1 + 7x7 


= 3x? — 4x1 X2 + 7x2 E 


La presencia de —4xıx2 en la forma cuadrática del ejemplo 1b) se debe a las entradas 
—2 fuera de la diagonal en la matriz A. En contraste, la forma cuadrática asociada con la 
matriz diagonal A del ejemplo la) no tiene el producto cruzado x1x2. 


EJEMPLO 2 Para x en R?, sea Q(x) = 5x? + 3x2 + 2x2 — x1x2 + 8x2x3. Escriba esta 
forma cuadrática como x”Ax. 


SOLUCIÓN Los coeficientes de r iz. Xa están en la diagonal de A. Para que A sea simé- 
trica, el coeficiente de xx; con i # j debe dividirse en partes iguales entre las entradas (i, j) 
y (j, 1) en A. El coeficiente de xıx3 es 0. Es sencillo comprobar que: 


5 —1/2 0 X1 
0(x) = XAx = [x X2 x3] —1/2 3 4 X2 a 
0 4 2 X3 
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EJEMPLO 3 Sea Q(x) = x? — 8xix2 — 5x2. Calcule el valor de Q(x) para x = 


[iapa 


SOLUCIÓN 
0(3,1) = (3) — 8(—3)(1) - 51)? = 28 
0(,-2) = (2? — 8(2)(22) - 5(-2? = 16 
0(1,-3) = (1)? — 8(1)(—3) - 523? = -20 a 
En algunos casos, las formas cuadráticas son más fáciles de usar cuando no tienen pro- 


ductos cruzados, es decir, cuando la matriz de la forma cuadrática es una matriz diagonal. Por 
fortuna, el producto cruzado se puede eliminar realizando un adecuado cambio de variable. 


Cambio de variable en una forma cuadrática 


Si x representa un vector variable en R”, entonces un cambio de variable es una ecuación 
de la forma 


x = Py, o, de manera equivalente, y =P”'x (1) 


donde P es una matriz invertible y y es un nuevo vector variable en R”. Aquí y es el vector 
de coordenadas de x con respecto a la base de R” determinada por las columnas de P. 
(Véase la sección 4.4). 

Si el cambio de variable (1) se efectúa en una forma cuadrática xTAx, entonces 


xAx = (Py)A(Py) = y PAP y = y (P"AP)y (2) 


y la nueva matriz de la forma cuadrática es PAP. Como A es simétrica, entonces el teorema 
2 garantiza que existe una matriz ortogonal P tal que PZAP es una matriz diagonal D, y así la 
forma cuadrática en (2) se convierte en y"Dy. Esta es la estrategia del siguiente ejemplo. 


EJEMPLO 4 Realice un cambio de variable que transforme la forma cuadrática del 


ejemplo 3 en una forma cuadrática sin productos cruzados. 


SOLUCIÓN La matriz de la forma cuadrática del ejemplo 3 es 


a=[_, 35] 


El primer paso es que A se diagonalice ortogonalmente. Sus valores propios resultan ser 
A=3yA= —7. Los vectores propios unitarios asociados son: 


La. | 2/75]. A 
[8 1 [Y] 


Esos vectores son automáticamente ortogonales (porque corresponden a diferentes valores 
propios), de manera que brindan una base ortonormal para R?. Sean 


1 245 1/75 f3 0 
E l »=|; E] 


Entonces, A = PDP"!y D = P'AP = PAP, como se indicó antes. Un cambio de variable 


conveniente es 
X1 yı 
x = Py, donde x = = 
A H nx [z] 


TEOREMA 4 
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De esta forma, 
xi—8x1x2 — 5x3 =x"Ax = (Py)A(Py) 
= y'P*APy = y Dy 
=3y -3 m 


Para ilustrar el significado de la igualdad de las formas cuadráticas del ejemplo 4, se 
puede calcular O(x) para x = (2, —2) empleando la nueva forma cuadrática. Primero, como 
x = Py, 


y = P`'x = Px 


212/45 -1/45 | JA 6/15 
YEEJ i5 2/5 || -27 | -2/75 


de manera que 


Por lo tanto, 


3y? — 7y3 = 3(6/ V5} — 12/45} = 3(36/5) — 7(4/5) 
= 80/5 = 16 


Este es el valor de Q(x) en el ejemplo 3 cuando x = (2, —2). Véase la figura 1. 


R? x'Ax 
Multiplicación R 
por P 0 16 
y Dy 
R? i 


FIGURA 1 Cambio de variable en xTAx. 


El ejemplo 4 ilustra el siguiente teorema. En esencia, la demostración del teorema se 
presentó antes del ejemplo 4. 


Teorema de los ejes principales 


Sea A una matriz simétrica de n x n. Luego, existe un cambio de variable ortogonal, 
x = Py, que convierte la forma cuadrática x”Ax en una forma cuadrática y"Dy sin 
productos cruzados. 


En el teorema, las columnas de P se llaman ejes principales de la forma cuadrática x7Ax. 
El vector y es el vector de coordenadas de x respecto de la base ortonormal de R” que dan 
esos ejes principales. 


Ejes principales desde un punto de vista geométrico 


Suponga que O(x) = x”Ax, donde A es una matriz simétrica invertible de 2 x 2, y sea c una 
constante. Es posible demostrar que el conjunto de todas las x en R? que satisfacen 


xX/Ax=cC (3) 
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corresponde a una elipse (o circunferencia), a una hipérbola, a dos rectas que se intersecan, 
a un solo punto, o quizá no contenga puntos. Si A es una matriz diagonal, la gráfica está en 
posición estándar, como se muestra en la figura 2. Si A no es una matriz diagonal, la gráfica 
de la ecuación (3) ha dado un giro respecto de la posición estándar, como se muestra en la 





Xa * 
2 
b Sa Z 
N Z, 
S 7 
Satana 
IMAS z 
| o | 
a Xi | A al i 
be” a] 
ARENAS 
/ NS 
Y SN 
l ` 
e ~ 
xi 22 xi x2 
— + — =l, a>b>0 — - — =], a>b>0 
a? b? a b? 
elipse hipérbola 


FIGURA 2 Una elipse y una hipérbola en posición estándar. 


figura 3. Encontrar los ejes principales (determinados por los vectores propios de A) equi- 
vale a encontrar un nuevo sistema de coordenadas con respecto al cual la gráfica está en 
posición estándar. 


Y 
Ya 22 Y 





a Y 








a) Sx? -4x,x, + 5x2 = 48 b) x - 8x,x,- 5x2 =16 


FIGURA 3 Una elipse y una hipérbola que no están en posición estándar. 


La hipérbola en la figura 3b) es la gráfica de la ecuación x7Ax = 16, donde A es la ma- 
triz del ejemplo 4. El eje y; positivo en la figura 3b) está en la dirección de la primera co- 
lumna de la matriz P del ejemplo 4, y el eje y2 positivo se encuentra en la dirección de la 
segunda columna de P. 


EJEMPLO 5 La elipse de la figura 3a) es la gráfica de la ecuación 5x? — 4x1x2 + 
5x2 = 48. Encuentre un cambio de variable que elimine el producto cruzado de la ecuación. 


SOLUCIÓN La matriz de la forma cuadrática es A = | m | Los valores propios de A 


a2 5 


resultan ser 3 y 7, con los vectores propios unitarios correspondientes 


1/42 1/42 
u; = us = 
LA A 1/42 





a) z=3x? + 7x7 
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Sea P = [u w] = bre e] Entonces, P diagonaliza ortogonalmente a A, 


de manera que el cambio de variable x = Py produce la forma cuadrática y” Dy = 3y? + 7y2. 
La figura 3a) muestra los nuevos ejes para este cambio de variable. E 


Clasificación de formas cuadráticas 


Cuando A es una matriz de n x n, la forma cuadrática O(x) = x7Ax es una función de valo- 
res reales con dominio R”. La figura 4 presenta las gráficas de cuatro formas cuadráticas 
con dominio [R?. Para cada punto x = (x1, x2) en el dominio de una forma cuadrática O, la 
gráfica muestra el punto (x1, x2, Z), donde z = Q(x). Observe que, excepto en x = 0, todos 
los valores de Q(x) son positivos en la figura 4a) y todos son negativos en la figura 4d). 
Las secciones transversales horizontales de las gráficas son elipses en la figura 4a) y 4d), y 
son hipérbolas en la figura 4c). 





c) 2=3x2-7x3 d) z=-3x? -7x2 


FIGURA 4 Gráficas de formas cuadráticas. 


DEFINICIÓN 


TEOREMA 5 


Los ejemplos sencillos de 2 x 2 de la figura 4 ponen de manifiesto las siguientes 
definiciones. 


Una forma cuadrática Q es: 


a) positiva definida si O(x) > 0 para toda x + 0, 
b) negativa definida si Q(x) < 0 para toda x + 0, 


c) indefinida si Q(x) toma valores positivos y negativos. 


También, se dice que Q es positiva semidefinida si Q(x) = 0 para toda x, y negativa se- 
midefinida si Q(x) < 0 para toda x. Las formas cuadráticas en los incisos a) y b) de la figura 4 
son semidefinidas positivas, pero la forma en a) se describe mejor como positiva definida. 

El teorema 5 caracteriza algunas formas cuadráticas en términos de valores propios. 


Formas cuadráticas y valores propios 


Sea A una matriz simétrica de n x n. Así, una forma cuadrática x7Ax es: 
a) positiva definida si y solo si todos los valores propios de A son positivos, 
b) negativa definida si y solo si todos los valores propios de A son negativos, O 


c) indefinida si y solo si A tiene valores propios positivos y negativos. 
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1.2 


Indefinida 


EJERCICIOS 


DEMOSTRACIÓN De acuerdo con el teorema de los ejes principales, existe un cambio or- 
togonal de variable x = Py tal que 


Q(x) = xx = y” Dy = 11y? + Aay? +e + Anyi (4) 


donde Aj,..., A, son los valores propios de A. Como P es invertible, existe una corresponden- 
cia uno a uno entre todas las x y todas las y diferentes de cero. Por lo tanto, los valores de Q(x) 
para x + 0 coinciden con los valores de la expresión en el miembro derecho de la ecuación 
(4), la cual, como es evidente, está controlada por los signos de los valores propios Aj,..., An, 
en las tres maneras descritas en el teorema. E 


EJEMPLO 6 ¿0(x) = 3x? + De + x? + 4x1x2 + 4x2x3 es positiva definida? 


SOLUCIÓN A causa de todos los signos positivos, esta forma “parece” positiva definida. 
Pero la matriz de la forma es 


3 2 0 
A=|2 2 2 
0 2. 1 


y los valores propios de A resultan ser 5, 2 y —1. Así, O es una forma cuadrática indefinida, y 
no positiva definida. E 


Con frecuencia, la clasificación de una forma cuadrática se realiza sobre la matriz de 
la forma. Por consiguiente, una matriz A positiva definida es una matriz simétrica para la 
cual la forma cuadrática x”Ax es positiva definida. Otros términos, tales como matriz posi- 
tiva semidefinida, se definen de manera análoga. 


NOTA NUMÉRICA 





Una manera rápida de determinar si una matriz simétrica es positiva definida consiste 
en intentar factorizar A en la forma A = R7R, donde RR es triangular superior con en- 
tradas diagonales positivas. (Un enfoque consiste en utilizar un algoritmo ligeramente 


modificado para la factorización LU). Tal factorización de Cholesky es posible si y solo 
si A es positiva definida. Véase el ejercicio complementario 7 al final del capítulo 7. 


PROBLEMA DE PRÁCTICA 


Describa una matriz A positiva semidefinida en términos de sus valores propios. 


1. Calcule la forma cuadrática x"Ax, cuando A = | 3 a] Xx 2 1/43 
1/3 1 ax=|x | bx=|-1| c)x=]| 1/43 
y X3 5 1/43 
a) x= H b) x= i Cc) x= [3| 3. Encuentre la matriz de la forma cuadrática. Suponga que x 
X2 1 3 está en R?. 
4 3 0 a) 10x? — 6x1 X2 — 3x2 b) 5x? + 3x1x> 


2. Determine la forma cuadrática x"Ax, para A = 


y 


uy 

N 

j: 
A 


. Obtenga la matriz de la forma cuadrática. Suponga que x está 
0 1 1 en R2. 


a) 20x? + 15x1x2 — 10x2 b) xıx2 


5. Determine la matriz de la forma cuadrática. Suponga que x está 
en R?. 


a) 8x? + 7x2 — 3x3 — 6x1 X2 + 4x1X3 — 2X2X3 
b) 4x1x> + 6xX1X3 si 8X2X3 

6. Encuentre la matriz de la forma cuadrática. Suponga que x está 
en R?. 
a) 5x? — X3 + 7x2 + 5x1 X2 — 3x1 X3 
b) x2? — 4x1 X2 + 4xX2X3 

7. Realice un cambio de variable, x = Py, que transforme la forma 
cuadrática x? + 10x1x2 + x2 en una forma cuadrática sin pro- 
ducto cruzado. Determine P y la nueva forma cuadrática. 

8. Sea A la matriz de la forma cuadrática 
9x? + Tos + 11x2 — 8x1X2 + 8X/X3 


Es posible demostrar que los valores propios de A son 3, 9 y 15. 
Encuentre una matriz ortogonal P tal que el cambio de variable 
x = Py transforme x”Ax en una forma cuadrática sin productos 
cruzados. Determine P y la nueva forma cuadrática. 


En los ejercicios 9 a 18, clasifique las formas cuadráticas. Después 
realice un cambio de variable, x = Py, que convierta la forma cua- 
drática en una que no incluya productos cruzados. Escriba la nueva 
forma cuadrática. Construya P utilizando los métodos de la sección 
7.1. 


9. 3x7 —4x1x2 + 6x3 10. 9x? — 8x1 x2 + 3x2 
11. 2x? + 10x,x2 + 2x2 12. —Sxj + 4x1x2 — 2x5 
13. x? — 6x1x2 + 9x2 14. 8x? + 6x1x2 


15. [M] —2x? — 6x2 — 9x2 — 9x? + 4x1x2 + 4x1x3 + 4x1Xx4+ 
6X3X4 

16. [M] 4x? + 4x2 + 4x7 + 4x2 4 3x1x2 + 3x3X4 — 4x1X4 + 
4xX2X3 

17. [M] x? + x? + x? + x? + 9x1x2 — 12x1 x4 + 12x2x3 + 9x3X4 

18. [M] 11x? — x2 





12x1x2 12x1x3 12x1xXx4 2X3X4 


19. ¿Cuál es el valor más grande posible de la forma cuadrática 
5x? + 8x2 six = (x1, x2) y x"x=1, es decir, si X + x = 1? 
(Intente algunos ejemplos de x). 

20. ¿Cuál es el valor más grande de la forma cuadrática 5x? — 3x3 
si xx = 1? 


En los ejercicios 21 y 22, las matrices son de n x n y los vec- 
tores están en R”. Marque cada enunciado como verdadero o falso. 
Justifique sus respuestas. 


21. a) La matriz de una forma cuadrática es una matriz simétrica. 


b) Una forma cuadrática no tiene productos cruzados si y solo 
si la matriz de la forma cuadrática es una matriz diagonal. 


c) Los ejes principales de una forma cuadrática x"Ax son vec- 
tores propios de A. 


d) Una forma cuadrática positiva definida O satisface O(x) > 0 
para toda x en R”. 
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e) Si todos los valores propios de una matriz simétrica A son 
positivos, entonces la forma cuadrática x"Ax es positiva 
definida. 


$) Una factorización de Cholesky de una matriz simétrica A 
tiene la forma A = RTR, para una matriz triangular superior 
R con entradas diagonales positivas. 


22. a 


b) Si A es simétrica y P es una matriz ortogonal, entonces el 
cambio de variable x = Py convierte xTAx en una forma 
cuadrática sin productos cruzados. 


La expresión |x|? es una forma cuadrática. 


© 


c) Si A es una matriz simétrica de 2 x 2, entonces el conjunto 
de x tal que x"Ax = c (para una constante c) corresponde a 
un círculo, una elipse o una hipérbola. 


d) Una forma cuadrática indefinida es positiva semidefinida 
o negativa semidefinida. 


e) Si A es simétrica y la forma cuadrática x7Ax solo tiene va- 
lores negativos para x + 0, entonces todos los valores pro- 
pios de A son negativos. 


Los ejercicios 23 y 24 muestran cómo clasificar una forma cuadrá- 
a 


tica O(x) = x"Ax, cuando A = | b 


| y det A + 0, sin obtener 
los valores propios de A. 


23. Si A; y A son los valores propios de A, entonces el polino- 
mio característico de A se puede escribir de dos maneras: 
det(A — AI) y (À — ài)X(Aà — ù). Con base en este hecho, de- 
muestre que À; + A2 = a + d (las entradas diagonales de A) 
y AA = det A. 


24. Compruebe los siguientes enunciados. 
a) Q es positiva definida si det A > 0 y a > 0. 
b) Q es negativa definida si det A > 0 ya < 0. 
c) Q es indefinida si det A < 0. 


25. Demuestre que si B es de m x n, entonces BTB es positiva se- 
midefinida; y si B es de n x n e invertible, entonces BTB es 
positiva definida. 


26. Demuestre que si una matriz A de n x n es positiva definida, 
entonces existe una matriz B positiva definida tal que A = BTB. 
[Sugerencia: Escriba A = PDP”, con P? = P”?. Construya una 
matriz C diagonal tal que D = CTC, y sea B = PCP”. Demues- 
tre que B funciona]. 


27. Sean A y B matrices simétricas de n x n cuyos valores pro- 
pios son todos positivos. Demuestre que todos los valores 
propios de A + B son positivos. [Sugerencia: Considere for- 
mas cuadráticas]. 


28. Sea A una matriz simétrica e invertible de n x n. Demuestre que 
si la forma cuadrática x”Ax es positiva definida, entonces tam- 
bién lo es la forma cuadrática x7A”'x. [Sugerencia: Considere 
valores propios]. 
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Positiva semidefinida 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Efectúe un cambio de variable ortogonal x = Py, y escriba 
x”Ax = y” Dy = Myg + 23 +e + Anya 


como en la ecuación (4). Si un valor propio —por ejemplo, àÀ;— fuera negativo, entonces 
x'Ax sería negativo para la x correspondiente a y = e; (la ¡-ésima columna de /,,). Así, to- 
dos los valores propios de una forma cuadrática positiva semidefinida deben ser no negativos. 
A la inversa, si los valores propios son positivos, la expansión anterior indica que x7Ax debe 
ser positiva semidefinida. 


7.3 | OPTIMIZACIÓN RESTRINGIDA 


Es frecuente que ingenieros, economistas, científicos y matemáticos necesiten encontrar el 
valor máximo o mínimo de una forma cuadrática O(x) para x en algún conjunto específico. 
Por lo común, el problema se puede adaptar de tal manera que x varíe sobre un conjunto de 
vectores unitarios. Este problema de optimización restringida tiene una solución interesante 
y elegante. El ejemplo 6 y el análisis de la sección 7.5 ilustrarán cómo se presentan en la 
práctica este tipo de problemas. 

El requisito de que un vector x en R” sea unitario se puede establecer en varias formas 
equivalentes: 


Ixf=L Ix? s1, x= 


X? Hate al (1) 


La versión ampliada de la ecuación (1) de x"x = 1 se utiliza comúnmente en las apli- 
caciones. 

Cuando una forma cuadrática O no tiene productos cruzados, es fácil encontrar el máxi- 
mo y el mínimo de O(x) parax"x = 1. 


EJEMPLO 1 Obtenga los valores máximo y mínimo de O(x) = 9x2? + 4x3 + 3x3 con 


la restricción xx = 1. 
SOLUCIÓN Como x2 y x? son no negativos, observe que 


4x3 < 9x3 y 3x7 < 9x3 


y por lo tanto, 
Q(X) = 97 + 4x3 + 3x5 
< 9x? + 9x2 + 9x2 
= Ax? + x2 + x?) 
=9 
siempre que x? T e + x? = 1. Así, el valor máximo de Q(x) no puede exceder 9 cuando 
x es un vector unitario. Además, Q(x) = 9 cuando x = (1, 0, 0). Por consiguiente, 9 es el 
valor máximo de Q(x) para x7x = 1. 
Para encontrar el valor mínimo de Q(x), observe que 
9x? > 3x?, 4x3 > 3x2 
y en consecuencia, 
Q) 2 3x? + 3x2 + 3x? = 3x? + x2 + x2) = 3 


siempre que x? + x3 + x? = 1]. Además, Q(x) = 3 cuando xı = 0, x2 = 0, y x3 = 1. Así, 
3 es el valor mínimo de Q(x) cuando x’x = 1. 


TEOREMA 6 
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En el ejemplo 1 es fácil ver que la matriz de la forma cuadrática O tiene valores propios 9, 
4 y 3, y que los valores propios mayor y menor son iguales al máximo y mínimo (restringidos) 
de O(x), respectivamente. Se verá que lo mismo es válido para cualquier forma cuadrática. 


3 0 
0 7 


gráfica de Q. La figura 2 solo muestra la parte de la gráfica dentro de un cilindro; la intersec- 
ción del cilindro con la superficie es el conjunto de puntos (x1, x2, z) tales que z = Q(x, x2) 
y x? + x2 = 1. Las “alturas” de esos puntos son los valores restringidos de Q(x). Geomé- 
tricamente, el problema de optimización restringido es localizar los puntos más alto y más 
bajo en la curva de intersección. 

Los dos puntos más altos sobre la curva están 7 unidades arriba del plano xıx2, en 
xı = 0 yx = +1. Esos puntos corresponden al valor propio 7 de A y a los vectores pro- 
pios x = (0, 1) y —x = (0, —1). De manera similar, los dos puntos más bajos sobre la curva 
están 3 unidades arriba del plano x¡x2, y corresponden al valor propio 3 y a los vectores pro- 
pios (1, 0) y (— 1, 0). El 


EJEMPLO 2 Sean A = | | y O(x) = xAx para x en R?. La figura 1 muestra la 























FIGURA 1:2:5 3x7 T 7x3, FIGURA 2 La intersección de z = 
3x? + 7x2 y el cilindro x? + x2 = 1. 


En la figura 2 cada punto de la curva de intersección tiene una coordenada z entre 3 y 7, 
y para cualquier número f entre 3 y 7, existe un vector unitario x tal que Q(x) = t. En otras 
palabras, el conjunto de todos los posibles valores de x7Ax, para ||x|| = 1, es el intervalo 
cerrado 3 < t S 7. 

Es posible demostrar que para cualquier matriz simétrica A, el conjunto de todos los 
posibles valores de x”Ax, para [|x]| = 1, es un intervalo cerrado sobre el eje real. (Véase el 
ejercicio 13). Denote los puntos extremos izquierdo y derecho de este intervalo con m y M, 
respectivamente. Es decir, sean 


m = mín (x"Ax : llx]| = 1), M= máx (xAx : lIx]| = 1) (2) 


En el ejercicio 12 se le pide demostrar que sí A es un valor propio de A, entonces m S À S M. 
El siguiente teorema dice que m y M son en sí mismos valores propios de A, justo como 
en el ejemplo 2.' 


Sea A una matriz simétrica, y m y M se definen como en la ecuación (2). Entonces M 
es el valor propio más grande A; de A y m es el valor propio más pequeño de A. El valor 
de x7Ax es M cuando x es un vector propio unitario u; correspondiente a M. El valor de 
x/Ax es m cuando x es un vector propio unitario correspondiente a m. 


1 Los términos mínimo y máximo en la ecuación (2), y menor y mayor en el teorema, se refieren al ordenamiento 
natural de los números reales, no a magnitudes. 
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DEMOSTRACIÓN A se diagonaliza ortogonalmente como PDP”*!. Se sabe que 

x/Ax = y'Dy cuando x = Py (3) 
También, 

Ixil = Pyl| = llyll para toda y 
porque PP = 1 y | Pyll? = (Py) (Py) = y"P*Py = yy = lIyll?. En particular, [|y]| = 1 
si y solo si ||x|| = 1. Así, x7Ax y y"Dy asumen el mismo conjunto de valores conforme x y y 
varían sobre el conjunto de todos los vectores unitarios. 


Para simplificar la notación, suponga que A es una matriz de 3 x 3 con valores propios 
a = b= c. Arregle las columnas (los vectores propios) de P de manera que P = [u; u, uz] y 





a 0 0 
D=|0 b 0 
0o 0 c 
Dado cualquier vector unitario y en R? con coordenadas y1, y2, y3, observe que 
ay? = ay 
by < ay% 
cy5 < ay3 


y se obtienen estas desigualdades: 


y` Dy 5 


ay + by3 + c93 


A 


ay? + ay} + ay 
aly? + y3 + y3) 


2 
=allyl" = a 


De esta manera, M = a, por definición de M. Sin embargo, y"Dy = a cuando y = e; = (1, 0, 
0), así que en efecto M = a. De acuerdo con la ecuación (3), la x que corresponde a y = e, es 
el vector propio u; de A, porque 


1 
x= Pe; = | u 110) u; ] 0 = Uj 
0 


Por lo tanto, M = a = el De; = u/Au;, lo que demuestra el enunciado sobre M. Un ar- 
gumento similar demuestra que m es el valor propio más pequeño, c, y ese valor de x7Ax se 


obtiene cuando x = Pez = uz. A 
32 

EJEMPLO 3 SeaA=|2 3 1 |. Encuentre el valor máximo de la forma cuadrá- 
1 1 4 


tica x7Ax sujeta a la restricción x"x = 1, y obtenga un vector unitario en el que se alcance 
dicho valor máximo. 


SOLUCIÓN Según el teorema 6, el valor máximo deseado es el valor propio más grande de 
A. La ecuación característica resulta ser 


0 = —1° + 104? — 274 + 18 = —(À — 6)(à — 3)(À — 1) 
El valor propio más grande es 6. 
El máximo restringido de x”Ax se obtiene cuando x es un vector propio unitario 
1 
para A = 6. Resuelva (A — 6/)x = 0 y encuentre un vector propio | 1 |. Establezca 
1/43 
u=|1/ v3 |. E 
1/43 


TEOREMA 7 
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En el teorema 7 y en aplicaciones posteriores, los valores de x7Ax se calculan con restric- 
ciones adicionales sobre el vector unitario x. 


Sean A, A; y u; como en el teorema 6. Así, el valor máximo de x"Ax sujeto a las 
restricciones 


O 
es el segundo valor propio más grande, A, y este máximo se logra cuando x es un 
vector propio u» correspondiente a A». 


El teorema 7 se demuestra mediante un argumento similar al anterior donde el teorema 
se reduce al caso en que la matriz de la forma cuadrática es diagonal. El siguiente ejemplo da 
una idea de la demostración para el caso de una matriz diagonal. 


EJEMPLO 4 Encuentre el valor máximo de 9x? + 4x3 + 3x3 con las restricciones 
xx =1 y x'u; = 0, donde u; = (1, O, 0). Observe que u; es un vector propio unitario corres- 


pondiente al valor propio más grande A = 9 de la matriz de la forma cuadrática. 


SOLUCIÓN Si las coordenadas de x son xy, x2, x3, entonces la restricción xu; = 0 significa 
simplemente que xı = 0. Para tal vector unitario, Xo + E =1l,y 


9x? + 4x2 + 3x2 = 4x3 + 3x3 
< 4x3 + 4x2 
= 4(x3 + x3 
=4 


Así, el máximo restringido de la forma cuadrática no excede 4. Y este valor se logra para 
x = (0, 1, 0), que es un vector propio para el segundo valor propio más grande de la matriz 
de la forma cuadrática. E 


EJEMPLO 5 Sean A la matriz del ejemplo 3 y u; un vector propio unitario correspon- 
diente al valor propio más grande de A. Encuentre el valor máximo de x”Ax sujeto a las 
condiciones 


xXx=1, xu=0 (4) 


SOLUCIÓN A partir del ejemplo 3, el segundo valor propio más grande de A es À = 3. 
Resuelva (A — 37)x = 0 para encontrar un vector propio, y normalícelo para obtener 


1/V6 
u = 1/46 
—2/ 4/6 


El vector u, es automáticamente ortogonal a u, porque los vectores corresponden a diferen- 
tes valores propios. Así, el máximo de x”Ax sujeto a las restricciones en la ecuación (4) es 3, 
que se obtiene cuando x = u». E 


El siguiente teorema generaliza el teorema 7 y, junto con el teorema 6, ofrece una útil 
caracterización de todos los valores propios de A. Se omite la demostración. 
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TEOREMA 8 





Sea A una matriz simétrica de n x n con una diagonalización ortogonal A = PDP”?, 
donde las entradas sobre la diagonal en D están ordenadas de tal manera que à; = M = 
-+ => A, y las columnas de P son los vectores propios unitarios correspondientes u;,..., Uy. 
Entonces, para k = 2,..., n, el valor máximo de x”Ax sujeto a las restricciones 


E O AE) 


es el valor propio Az, y este máximo se logra en x = uz. 


El teorema 8 será útil en las secciones 7.4 y 7.5. La siguiente aplicación solo requiere 
del teorema 6. 


EJEMPLO 6 El gobierno de un condado planea reparar x cientos de millas de caminos 
públicos y puentes, y mejorar y cientos de acres de parques y áreas recreativas durante el 
próximo año. El condado debe decidir cómo distribuir sus recursos (fondos, equipo, mano 
de obra, etc.) entre esos dos proyectos. Si es más eficaz en términos de costos trabajar simul- 
táneamente en ambos proyectos en lugar de trabajar en uno solo, entonces x y y podrían sa- 
tisfacer una restricción del tipo 


4x? + 9y? < 36 


Véase la figura 3. Cada punto (x, y) en el conjunto factible sombreado representa una posible 
obra pública programada para el año. Los puntos sobre la curva de restricción, 4x? + 9y? = 36, 
utilizan las cantidades máximas de recursos disponibles. 





y 
Parques y 
recreación 
2| 4° +9y=36 
Conjunto ^ 
factible 
| x 
3 





Reparación de caminos y puentes 


FIGURA 3 Programas de trabajos públicos. 


Al elegir su programa de obras públicas, el condado quiere considerar las opiniones de 
sus residentes. Para medir el valor, o utilidad, que los residentes de un lugar asignarían a los 
diversos programas de trabajo (x, y), algunas veces los economistas emplean una función de 
la forma 


q(x, y) = xy 


El conjunto de puntos (x, y) en el cual q(x, y) es una constante se denomina curva de in- 
diferencia. En la figura 4 se muestran tres de estas curvas. Los puntos sobre una curva de 
indiferencia corresponden a las alternativas que los residentes del condado, como grupo, en- 
contrarían igualmente valiosas.? Encuentre el programa de obras públicas que maximice la 
función utilidad q. 


SOLUCIÓN La ecuación de restricción 4x? + 9y? = 36 no describe un conjunto de vectores 
unitarios, pero un cambio de variable puede resolver el problema. Rescriba la restricción en 


la forma 
DA 


2 Las curvas de indiferencia se analizan en Michael D. Intriligator, Ronald G. Bodkin y Cheng Hsiao, Econometric 
Models, Techniques, and Applications (Upper Saddle River, NJ: Prentice-Hall, 1996). 


7.3 EJERCICIOS 


En los ejercicios 1 y 2, encuentre el cambio de variable x = Py que 
transforme la forma cuadrática x”Ax en y"Dy como se muestra. 
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Parques y 4x2 + 9y2=36 
áreas de 
recreación (curvas de indiferencia) 
14+ -X q&,y)=4 
| — q(x, y) =3 
A x 
2.1 q(x, y)=2 





Reparación de caminos y puentes 


FIGURA 4 El programa de obras públicas óptimo 
es (2.1, 1.4). 


y defina 


A = x= >, es decir, x=3x1 y y=2x 


3 > 
Entonces, la ecuación de restricción se convierte en 


2 2_ 
xi +x; =l 


y la función utilidad se convierte en q(3x1, 2x2) = (3x1)(2x2) = 6x1 x2. Sea xX = i l 
J 


Entonces, el problema es maximizar Q(x) = 6xıx2 sujeto a xx = 1. Observe que Q(x) = 
x"Ax, donde 


Los valores propios de A son +3, con vectores propios 1/42 arad=3 1/42 ara 


A = —3. Así, el valor máximo de O(x) = q(x;, x2) es 3, que se alcanza cuando xı = 1/42 
y x2=1/42. 

En términos de las variables originales, el programa de trabajos públicos óptimo es 
x= 3x, = 3/42 = 2.1 cientos de millas de caminos y puentes, y y = 2x2 = V2 = 1.4 
cientos de acres de parques y áreas de recreación. El programa de obras públicas óptimo 
es justo el punto donde se encuentran la curva de restricción y la curva de indiferencia 
q(x, y) = 3. Los puntos (x, y) con la utilidad más alta están sobre las curvas de indiferen- 
cia que no tocan la curva de restricción. Véase la figura 4. E 


PROBLEMAS DE PRÁCTICA 


1. Sea Q(x) = 3x? + 3x2 + 2x1x2. Encuentre un cambio de variable que transforme Q en 
una forma cuadrática sin el producto cruzado, y determine la nueva forma cuadrática. 


2. Con OQ como en el problema 1, encuentre el valor máximo de O(x) con la restricción 


xx = 1, y determine un vector unitario en el que se logre el máximo. 


En los ejercicios 3 a 6, encuentre: a) el valor máximo de O(x) con 
la restricción xx = 1, b) un vector unitario u donde se logre este 


máximo, y c) el máximo de Q(x) con las condiciones x? 


1. 5x? + 6x2 + 7x2 + 4x1x2 — 4x2x3 = 9y? + 6y2 + 3y? 
2. 3x? + 2x2 + 2x3 + 2x1x2 + 2x1X3 + 4xX2xX3 = 5y? + 2y2 


[Sugerencia: x y y deben tener el mismo número de coorde- 
nadas, de manera que la forma cuadrática que se muestra aquí 
debe tener un coeficiente cero para y?]. 


x=1ly 
x'u =0. 


3. Q(x) = 5x? + 6x2 + 7x3 + 4x1xX2 — 4x2X3 


(Véase el ejercicio 1). 
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10. 


11. 


El valor máximo de Q(x) sujeto 2 
axíx=1es4. 





Q(x) = 3x2 + 2x2 + 2x2 42x1x2 + 2x1X3 + 4x2X3 

(Véase el ejercicio 2). 

Q(x) = 5x? + 5x2 — 4x1 x2 

Q(X) = 7x? + 3x2 + 3x1xX2 

Sea Q(x) = —2x? — x2 + 4x1x2 + 4x2x3. Determine un vector 
unitario x en R? en el cual Q(x) sea máximo, con la restricción 
x/x = 1. [Sugerencia: Los valores propios de la matriz de la 
forma cuadrática Q son 2, — 1 y —4]. 


Sea Q(x) = 7x? + x2 + 7x2 — 8x1 x2 — 4x1 X3 — 8x2x3. Obten- 
ga un vector unitario x en R3 en el que Q(x) sea máximo, con 
la restricción x"x = 1. [Sugerencia: Los valores propios de la 


matriz de la forma cuadrática O son 9 y —3]. 


Encuentre el valor máximo de Q (x) = 7x? + 3x2 — 2x1 X2, cOn 
la restricción x? + x2 = 1. (No continúe para encontrar un vec- 
tor donde se alcance el máximo). 


Obtenga el valor máximo de Q (x) = —3x? + 5x3 — 2x1 x2, con 
la restricción x? + x? = 1. (No continúe para encontrar un vec- 
tor donde se alcance el máximo). 


Suponga que x es un vector propio unitario de una matriz A 
correspondiente a un valor propio 3. ¿Cuál es el valor de x7Ax? 


12. 


13. 


Sea A cualquier valor propio de una matriz simétrica A. Justi- 
fique el enunciado hecho en esta sección de que m S À S M, 
donde m y M se definen como en la ecuación (2). [Sugerencia: 
Encuentre una x tal que A = x7Ax]. 


Considere que A es una matriz simétrica de n x n, y que M y m 
representan los valores máximo y mínimo de la forma cuadrática 
x"Ax; denote los vectores propios unitarios correspondientes co- 
mo u; y u,. Los siguientes cálculos demuestran que dado cual- 
quier número f entre M y m, existe un vector unitario x tal que 
t = xTAx. Compruebe que £ = (1 — a)m + aM para algún nú- 
mero a entre O y 1. Después deje que x = Y 1 — qu, + vau, 


y demuestre que x'x = 1 y x/Ax =1f. 


[M] En los ejercicios 14 a 17, siga las instrucciones para los ejer- 








cicios 3 a 6. 

14. xx +3x1x3 + 30x¡x4 + 30x2X3 + 3X2X4 + X3X4 

15. 3x1x2 + 5x1X3 + 7X1X4 + 7X2X3 + 5X2X4 + 3X3X4 

16. 4x?— 6x1x2 — 10x1x3 — 10x1X4 — Óx2x3 — Óx2X4 — 2X3Xa4 

17. —6x?— 10x2 — 13x2— 1312 — 4x1x2 — 4x1x3 — 4x1x4 + 
6X3Xa4 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 





172 


1. La matriz de la forma cuadrática es A = | 
pios, 4 y 2, y los vectores propios unitarios correspondientes, | 1/2 


Así 1 bio deseado d 1abl = Py, donde P = 
sí que el cambio deseado de variable es x y, donde a 


3 


1.3 | Es fácil encontrar los valores pro- 


1/12 1/42 
YI v2} 


1442 =1/4/2 , 
a pss 


un error común es olvidar normalizar los vectores propios). La nueva forma cuadrática 
es y Dy = 4y? + To: 


El máximo de Q(x) para un vector unitario x es 4, y el máximo se logra en el vector pro- 


pio unitario | 1/ Y [Una respuesta incorrecta común es | 0 | Este vector maximiza 


la forma cuadrática y"Dy en vez de O(x)l. 


7.4 DESCOMPOSICIÓN EN VALORES SINGULARES 


Los teoremas de diagonalización de las secciones 5.3 y 7.1 intervienen en muchas aplica- 
ciones interesantes. Por desgracia, como se sabe, no todas las matrices se pueden factorizar 
como A = PDP”! con D diagonal. Sin embargo, ¡una factorización A = QDP”! es posi- 
ble para cualquier matriz A de m x n! Una factorización especial de este tipo, llamada des- 
composición en valores singulares, es una de las más útiles factorizaciones matriciales en 


álgebra lineal aplicada. 


La descomposición en valores singulares se basa en la siguiente propiedad de la diago- 
nalización ordinaria que se puede imitar para matrices rectangulares: los valores absolutos de 
los valores propios de una matriz simétrica A miden las cantidades que A estira o comprime 
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ciertos vectores (los vectores propios). Si Ax = Ax y l|xl| = 1, entonces 
lAxl| = llAxl| = [A] Iixl| = |A| (1) 


Si À; es el valor propio con la mayor magnitud, entonces un vector propio unitario vı CoO- 
rrespondiente identifica una dirección en la cual el efecto de estiramiento de A es máximo. 
Es decir, la longitud de Ax se maximiza cuando x = vi, y || 4v, || = |A1l, por la ecuación (1). 
Esta descripción de v; y |A¡| tiene un análogo para matrices rectangulares que conducirán a 
la descomposición en valores singulares. 


4 11 14 
8 7 2 
la esfera unitaria {x : ||x|| = 1} en R? sobre una elipse en R?, como se muestra en la figura 1. 
Encuentre un vector unitario x en el que la longitud |lAx]| se maximiza, y calcule esa longitud 
máxima. 


EJEMPLO 1 Si 4 = | 


| entonces la transformación lineal x > Ax mapea 


= 
u 

= 
N 


Multiplicación 
por A 




















FIGURA 1 Una transformación de R? a R?. 





|, y llaxiP 


SOLUCIÓN La cantidad [Ax]? se maximiza con la misma x que maximiza |lAx 
es más fácil de estudiar. Observe que 


Ax? = (407 (4x) = xA"Ax = x"(474)x 


Además, AZA es una matriz simétrica, ya que (ATA)! = ATAT = ATA. Así que ahora el pro- 
blema es maximizar la forma cuadrática x"(A7A)x sujeta a la restricción ||x|| = 1. Por el teore- 
ma 6 de la sección 7.3, el valor máximo es el valor propio más grande A, de AA. Además, el 
valor máximo se alcanza en un vector propio unitario de A7A correspondiente a Ay. 

Para la matriz A en este ejemplo, 


4 8 80 100 40 
AA=| 11 7 £ a | =| 100 170 140 
14 -2 40 140 200 


Los valores propios de ATA son A; = 360, Az = 90 y A3 = 0. Los vectores propios unitarios 
correspondientes son, respectivamente, 


1/3 —2/3 2/3 
v = 2/3 ť> HYH = —1/3 Je NS —2/3 
2/3 2/3 1/3 


El valor máximo de ||Ax||? es 360, que se alcanza cuando x es el vector unitario vı. El vector 
Av; es el punto sobre la elipse de la figura 1 más alejado del origen, a saber, 


4 un 1718 18 
Ml o ol 


2/3 
Para ||x|| = 1, el valor máximo de ||4x]| es || Avı l| = 4360 = 6/10. E 


El ejemplo 1 sugiere que el efecto de A sobre la esfera unitaria en R? está relacionado con 
la forma cuadrática x"(A7A)x. De hecho, el comportamiento geométrico general de la trans- 
formación x > Ax se refleja en esta forma cuadrática, como se verá más adelante. 
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FIGURA 2 


TEOREMA 9 


Los valores singulares de una matriz de m x n 


Sea A una matriz de m x n. AZA es simétrica y se puede diagonalizar ortogonalmente. Sea 
[v;..., v,) una base ortonormal para R” que consiste en vectores propios de ATA, y sean 
M1»».., An los valores propios asociados de ATA. Por lo tanto, para 1 < i £ n, 


|Av;||? = (Av;)TAv; = v? ATAv; 
= y (A¡v;) Puesto que v; es un vector propio de ATA 


= A; Porque v; es un vector unitario (2) 


De esta forma, todos los valores propios de ATA son no negativos. Al volver a numerar, si es 
necesario, se puede suponer que los valores propios están arreglados de manera que 


AZ A> e> Ana 


Los valores singulares de A son las raíces cuadradas de los valores propios de ATA, que 
se denotan con 0,..., On, y se arreglan en orden decreciente. Es decir, 0i = i para 
1 si <n. De acuerdo con la ecuación (2), los valores singulares de A son las longitudes 
de los vectores AV;,..., AV. 


EJEMPLO 2  SeaA la matriz del ejemplo 1. Como los valores propios de 474 son 360, 90 
y 0, entonces los valores singulares de A son 


oi = 4360 = 6410, 0,=vV9=3410, 03=0 


A partir del ejemplo 1, el primer valor singular de A es el máximo de ||Ax|| sobre todos los 
vectores unitarios, y se alcanza el máximo en el vector propio unitario vı. El teorema 7 de 
la sección 7.3 indica que el segundo valor singular de A es el máximo de ||Ax|| sobre todos los 
vectores unitarios que sean ortogonales a vı, y este máximo se logra en el segundo vector 
propio unitario, va (ejercicio 22). Para v, del ejemplo 1, 


-2/3 


4 11 14 3 
am=|; 7 5 e =[_3] 


Este punto está sobre el eje menor de la elipse de la figura 1, así como Av; está sobre el eje 
mayor. (Véase la figura 2). Los primeros dos valores singulares de A son las longitudes de los 
semiejes mayor y menor de la elipse. E 


En la figura 2, no es casual que Av; y Av, sean ortogonales, como muestra el siguiente 
teorema. 


Suponga que {vV1,..., Vn} es una base ortonormal de R” que consiste en vectores pro- 
pios de A7A, arreglados de tal forma que los valores propios correspondientes de A7A 
satisfacen À; = + = Àn, y suponga que A tiene r valores singulares diferentes de cero. 
Entonces, {Av1,..., AV,} es una base ortogonal para Col A, y rango A = r. 


DEMOSTRACIÓN Como y, y Av; son ortogonales para i # j, 
(Av) (Av;) = v/ A “Av; =v/(Ajv;) =0 


Por lo tanto, (Avj,..., Av,) es un conjunto ortogonal. Además, ya que las longitudes de los 
vectores Av;,..., Av, son los valores singulares de A, y puesto que hay r valores singulares 
diferentes de cero, Av; # 0 si y solo si 1 < ¡ < r. Así que Av;,..., Av, son vectores linealmente 


TEOREMA 10 
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independientes, y están en Col A. Finalmente, para cualquier y en Col A, por ejemplo, y = Ax, 
se puede escribir xX = c¡V¡ + *"* + CpVn, Y 


y = ÁX = G Áv +: +Cy AV? + Cy41AVr+1 ++: +Cp AV 
AVI ++ +ce, Av, +0+--+0 


Así, y está en Gen [Av;,..., Av,), lo que demuestra que [Av;,..., Av,) es una base (ortogonal) 
para Col A. Por lo tanto, rango A = dim Col A = r. E 


NOTA NUMÉRICA 





En algunos casos, el rango de A puede ser muy sensible a pequeños cambios en las 
entradas de A. El método evidente de contar el número de columnas pivote en A no 
funciona muy bien si A se reduce por filas con una computadora. Con frecuencia, el 
error por redondeo genera una forma escalonada con rango completo. 

En la práctica, la manera más confiable de estimar el rango de una matriz A grande 


consiste en contar el número de valores singulares diferentes de cero. En este caso, se 
supone que los valores singulares distintos de cero y extremadamente pequeños son 
iguales a cero para todos los fines prácticos, y el rango efectivo de la matriz es el núme- 


ro que se obtiene al contar los valores singulares restantes diferentes de cero. ! 


Descomposición en valores singulares 


La descomposición de A implica a una matriz >, “diagonal” de m x n de la forma 


D 0 
aa | 0 al <— m — rfilas 6) 
4 
L— n — r columnas 


donde D es una matriz diagonal de r x r para alguna r que no exceda el mínimo de m y n. [Si 
r es igual a m o n o a ambos, entonces no aparecen algunas (o todas) las matrices cero]. 


Descomposición en valores singulares 


Sea A una matriz de m x n con rango r. Entonces existe una matriz >, de m x n como 
la de la ecuación (3) para la cual las entradas diagonales en D son los primeros r va- 
lores singulares de A, o1 = o2 = -+ = 0, > 0, y existen una matriz ortogonal U de 
m x m y una matriz ortogonal V de n x n tales que 


A =U2V" 


Cualquier factorización A = U2V”, con U y V ortogonales, > como en la ecuación (3), 
y entradas diagonales positivas en D, se llama descomposición en valores singulares (o 
DVS) de A. Las matrices U y V no están determinadas de forma única por A, pero las entra- 
das diagonales en D son necesariamente los valores singulares de A. Véase el ejercicio 19. 
Las columnas de U en esta descomposición se llaman vectores singulares izquierdos de A, 
y las columnas de V se llaman vectores singulares derechos de A. 


1 En general, no es sencillo estimar el rango. Para un análisis de los aspectos sutiles implicados, véase Philip E. 
Gill, Walter Murray y Margaret H. Wright, Numerical Linear Algebra and Optimization, vol.1 (Redwood City, CA: 
Addison-Wesley, 1991), sección 5.8. 
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DEMOSTRACIÓN Sean A; y v; como en el teorema 9, así [Av;,..., Av,) es una base ortogo- 
nal para Col A. Normalice cada Av; para obtener una base ortonormal (u;,..., u,), donde 


1 1 A 
u; = AV; = — AV; 
| 4v,l| Oi 
y 
AV; = 0/0; (l<i<r) (4) 


Ahora se extiende (u;,..., u,) a una base ortonormal {u;,..., Um} de R”, y sean 
U = |u; Ww +e Un ] y V = [v vV e Vr ] 
Por construcción, U y V son matrices ortogonales. También, a partir de la ecuación (4), 


AV =[Av1 -** Av, 0 --- 0] =[01u1 +** 0,4, 0 --- 0] 


Sea D la matriz diagonal con entradas diagonales 0,,..., 9,, Con >, como en la ecuación 
(3) anterior. Entonces, 





01 0 
O2 0 
UX=[|u u >- un] 
0 O, 
0 |o 
=|ou = ou, 0 --- 0] 
= AV 
Puesto que V es una matriz ortogonal, entonces UV? = AVV? = A. E 


Los siguientes dos ejemplos se concentran en la estructura interna de una descomposi- 
ción en valores singulares. Un algoritmo eficiente y numéricamente estable para esta descom- 
posición utilizaría un enfoque diferente. Véase la nota numérica al final de la sección. 


EJEMPLO 3 Utilice los resultados de los ejemplos 1 y 2 para construir una descompo- 


sición en valores singulares de A = E : : r | 


SOLUCIÓN Una construcción se puede dividir en tres pasos. 


Paso 1. Encuentre una diagonalización ortogonal de ATA. Es decir, determine los valores 
propios de ATA y un conjunto ortonormal correspondiente de vectores propios. Si A tuviera 
solo dos columnas, los cálculos podrían realizarse a mano. Matrices mucho más grandes, por 
lo general, requieren de un programa de matrices.? Sin embargo, para la matriz A en cuestión, 
los datos propios para ATA se dan en el ejemplo 1. 


Paso 2. Obtenga V y >. Acomode los valores propios de ATA en orden decreciente. En el 
ejemplo 1, los valores propios ya están listados en orden descendente: 360, 90 y 0. Los vec- 
tores propios unitarios correspondientes, V1, V2 y V3, son los vectores singulares derechos 
de A. Utilizando el ejemplo 1, se construye 


1/3 —2/3 2/3 
V = [vı V2 v] = 2/3 —1/3 —2/3 
2/3 2/3 1/3 


2 Véase la Guía de estudio si se desea consultar las instrucciones adecuadas para software y la calculadora gra- 
ficadora. MATLAB, por ejemplo, puede dar los valores propios y los vectores propios mediante una sola instruc- 
ción, eig. 
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Las raíces cuadradas de los valores propios son los valores singulares: 
01 = 6v 10, 079 = 3v 10, 03 = 0 


Los valores singulares diferentes de cero son las entradas diagonales de D. La matriz >, tiene el 
mismo tamaño que A, con D en su esquina superior izquierda y ceros en las entradas restantes. 


_|6v10 0 B _| 64/10 0 0 
p=| 0 Sn): e a=] o 34/10 J 


Paso 3. Construya U. Cuando A tiene rango r, las primeras r columnas de U son los vectores 
normalizados obtenidos de Av;,..., AV,. En este ejemplo, A tiene dos valores singulares dife- 
rentes de cero, de manera que rango A = 2. Recuerde de la ecuación (2) y del párrafo anterior 
al ejemplo 2 que [l4v;]| = a, y llAva]| = 9. Por lo tanto, 


eel 1 [18] |3/v10 
== gls] = a) 

o1 o 1l ll DTO 
E 270») 5 EN 


Observe que {u;, u2} ya es una base para [R?, por lo que no se necesitan vectores adicionales 
para U, y U = [u; u>]. La descomposición en valores singulares de A es 


Ji a ma] k 0 J 1/3 2/3 2/3 


1/V10 -3/vV10 0 34/10 0 e Eo 1 


T T T 
U y yT a 
1 —1 
EJEMPLO 4 Encuentre una descomposición en valores singulares de A=| -2 2 
2 —2 
SOLUCIÓN Primero, calcule ATA = E al Los valores propios de A7A son 18 y 0, 


con los vectores propios unitarios correspondientes 


RA _| 1/72 
vi = IS V = 1/ v2 


Esos vectores unitarios forman las columnas de V: 


2 _| 1/42 1/42 
des a| i A] 


Los valores singulares son 0, = V18 = 342 y a, = 0. Como solo existe un valor sin- 
gular distinto de cero, la “matriz” D se puede escribir como un número individual. Es de- 
cir, D =3w2. La matriz * tiene el mismo tamaño que A, con D en su esquina superior 
izquierda: 


D 0 3/2 0 
s5=|0 O|=| O 0 
0o o0 0 0 


Para construir U, primero se obtienen Av; y Av): 


2/12 0 
Avy = —4/4/2 , Av =]|0 
4/42 0 
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FIGURA 3 


Para validar los cálculos, compruebe que || Av, || = 0, = 342. Desde luego, Av, = 0 porque 
I Aval] = o = 0. Hasta ahora, la única columna encontrada para U es 
1/3 
uü; = —— Avı = —2/3 
3V2 2 /3 


Las otras columnas de U se obtienen ampliando el conjunto (u¡) a una base ortonormal 
para R°. En este caso, se requieren dos vectores unitarios ortogonales uz y uz que sean ortogo- 
nales a u4. (Véase la figura 3). Cada vector debe satisfacer ux = 0, lo que es equivalente a 


la ecuación xı — 2x2 + 2x3 = 0. Una base para el conjunto solución de esta ecuación es 


2 —2 
WwW = 1 > W2 = 0 
0 1 


(Compruebe que w; y w, son ortogonales a u,). Aplique el proceso de Gram-Schmidt (con 
normalizaciones) a [w,, w2), para obtener 


2/5 —2/ 4/45 
w=|1/V45|, u= 4/1/45 
0 5/4/45 


Finalmente, establezca U = [u; u> us], tome > y V7 de las ecuaciones anteriores, y escriba 


11 1/3 LS =2/445 [3/2 0 
papi w rape yeva 
2 -2 2/3 0 5/1/45 0o 0 


Aplicaciones de la descomposición en valores singulares 


Como se mencionó antes, la DVS se utiliza con frecuencia para estimar el rango de una 
matriz. Ahora se describirán brevemente otras aplicaciones numéricas, y en la sección 7.5 se 
expone una aplicación al procesamiento de imágenes. 


EJEMPLO 5 (El número de condición) La mayoría de los cálculos numéricos que im- 
plican una ecuación Ax = b son tan confiables como es posible cuando se utiliza la DVS de 
A. Las dos matrices ortogonales U y V no afectan las longitudes de vectores o los ángulos 
entre vectores (teorema 7 de la sección 6.2). Cualquier posible inestabilidad en los cálcu- 
los numéricos se identifica en >. Si los valores singulares de A son extremadamente grandes 
o pequeños, los errores por redondeo son casi inevitables, pero un análisis de errores se faci- 
lita si se conocen las entradas en $, y V. 

Si A es una matriz invertible de n x n, entonces la razón o,/0, de los valores singulares 
más grande y más pequeño da el número de condición de A. Los ejercicios 41 a 43 de la 
sección 2.3 mostraron cómo el número de condición afecta la sensibilidad de una solución de 
Ax = b ante cambios (o errores) en las entradas de A. (En realidad, un “número de condición” 
de A se puede calcular en diversas formas, pero la definición que se presenta aquí se utiliza 
ampliamente para estudiar Ax = b). E 


EJEMPLO 6 (Bases para subespacios fundamentales) Dada una DVS para una matriz A 
de m x n, sean u;,..., U,, los vectores singulares izquierdos, v;,..., V, los vectores singulares 
derechos, (";,..., 9, los valores singulares, y r el rango de A. De acuerdo con el teorema 9, 


(u,..., u,) 65) 


es una base ortonormal para Col A. 








Los subespacios fundamentales en 
el ejemplo 4. 


TEOREMA 
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Recuerde del teorema 3 de la sección 6.1 que (Col 4)* = Nul 4”. Por lo tanto, 


(U,41,..-> Un) (6) 


es una base ortonormal para Nul 4”. 

Puesto que [|Av;|| = 0; para 1 S i £ n, y c; es 0 si y solo si i > r, por lo tanto los vectores 
V;+1s---, Vn generan un subespacio de Nul A de dimensión n — r. De acuerdo con el teorema 
del rango, dim Nul A = n — rango A. De ello se deduce que 


{V1 Va} (7) 


es una base ortonormal para Nul A, de acuerdo con el teorema de la base (en la sección 4.5). 
A partir de (5) y (6), el complemento ortogonal de Nul A7 es Col A. Intercambiando A y 
AT, observe que (Nul A)+ = Col A7 = Fil A. En consecuencia, a partir de (7), 


(Vb... vr) (8) 


es una base ortonormal para Fil A. 

La figura 4 resume las ecuaciones (5) a (8), pero muestra la base ortogonal 
[c1U;,..., 0,U,) para Col A en vez de la base normalizada, con la finalidad de recordar- 
nos que Av; = du; para l = ¡<= r. Las bases ortonormales explícitas para los cuatro sub- 
espacios fundamentales determinados por A son útiles en algunos cálculos, particularmente 
en problemas de optimización restringidos. a 


Multiplicación 


por A 





SN 


019, Col A = Fil 47 





FIGURA 4 Los cuatro subespacios fundamentales y 
la acción de A. 


Los cuatro subespacios fundamentales y el concepto de valores singulares proporcionan 
los enunciados finales del teorema de la matriz invertible. (Recuerde que se omitieron los 
enunciados del teorema acerca de A”, ya que, de otra forma, el número de enunciados se du- 
plicaría). Los otros enunciados se presentaron en las secciones 2.3, 2.9, 3.2, 4.6 y 5.2. 


Teorema de la matriz invertible (concluido) 


Sea A una matriz de n x n. Entonces, cada uno de los siguientes enunciados es equiva- 
lente al enunciado de que A es una matriz invertible. 


u) (Col A)+= (0). 
y) (Nul4)-=R”. 
w) Fil A = R”. 


x) A tiene n valores singulares diferentes de cero. 
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EJEMPLO 7  (DVS reducida y la seudoinversa de A) Cuando 2, contiene filas o columnas 
de ceros, es posible una descomposición más compacta de A. Utilizando la notación ya es- 
tablecida, sea r = rango A, y U y V se particionan en submatrices cuyos primeros bloques 
contienen r columnas: 

U = |U, Um-r], donde U, = [u] =- u] 

V=I[VW Vir], donde V, = [v;i =- v] 
Entonces U, es de m X r, y V, es de n x r. (Para simplificar la notación, considere Um- 


o V,,-, aun cuando tal vez alguna de ellas no tenga columnas). Por lo tanto, la multiplicación 
de matrices particionadas indica que 


Do E v? 
A=[U, Um- r | =U, DV} 9 
o ml olly | 0) 


Esta factorización de A se llama descomposición en valores singulares reducida de A. 
Como las entradas diagonales en D son diferentes de cero, D es invertible. La siguiente 
matriz se llama la seudoinversa (o inversa de Moore-Penrose) de A: 


At = V,D' UF (10) 
Al final del capítulo, los ejercicios complementarios 12 a 14 exploran algunas de las propie- 


dades de la descomposición en valores singulares reducida y de la seudoinversa. E 


EJEMPLO 8 (Solución por mínimos cuadrados) Dada la ecuación Ax = b, utilice la seu- 
doinversa de A en la ecuación (10) para definir 


x= Atb = V,D'U b 
Entonces, a partir de la DVS en la ecuación (9), 
AÌ = (U, DV) (V, D'U b) 


= U,DD”*UJ'b Porque VTV, = L, 

= U,UJb 
De (5) se deduce que U, U," b es la proyección ortogonal P de b sobre Col A. (Véase el teore- 
ma 10 de la sección 6.3). Por lo tanto, X es una solución por mínimos cuadrados de Ax = b. 


En efecto, esta X tiene la longitud más pequeña en comparación con todas las soluciones por 
mínimos cuadrados de Ax = b. Véase el ejercicio complementario 14. E 


NOTA NUMÉRICA 





Los ejemplos 1 a 4 y los ejercicios ilustran el concepto de valores singulares y sugieren 
cómo efectuar cálculos a mano. En la práctica, se debería evitar el cálculo de ATA, por- 
que cualquier error en las entradas de A se eleva al cuadrado en las entradas de ATA. 


Existen métodos iterativos rápidos que producen los valores singulares y los vectores 
singulares de A con muchos decimales. 
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pp. 390-398, 409-421. 
PROBLEMA DE PRÁCTICA 


Dada una descomposición en valores singulares, A = UV”, encuentre una DVS de A7. 
¿Cómo están relacionados los valores singulares de A y 47? 


7.4 EJERCICIOS 


En los ejercicios 1 a 4, obtenga los valores singulares de las 40 —.78 .47 7.10 0 0 
matrices. A= .37 —.33 —.87 0 3.10 0 
—.84 —.52 —.16 0 0 0 
1 1 0 2 5 0 
x | .76 .64 —.12 
i N 1 i E 2 .58 —.58 .58 
i o s6 í 0 s3 a) ¿Cuál es el rango de A? 


b) Utilice esta descomposición de A, sin hacer cálculos, y escri- 
ba una base para Col A y una base para Nul A. [Sugerencia: 
Primero escriba las columnas de V]. 


En los ejercicios 5 a 12, encuentre una DVS para cada ma- 
triz. [Sugerencia: En el ejercicio 11, una elección para U es 


-1/3 2/3 2/3 ; pue en y 
2/3 —1/3 2/3 |. En el ejercicio 12, una columna de U 16. Repita el ejercicio 15 para la siguiente DVS de una matriz A 


2/3 2/3 -1/3 de 3 x 4: 
—.86 —.11 —.50 12.48 0 0 0 
1/46 A=| 31 68 —.67 0 634 0 0 
puede ser| —2/v6 |]. 41 -.73 —.55 0 0 0 0 
VAR .66 —.03 —.35 .66 
5 E J 6 E a —.13 —.90 —.39 —.13 
e 0 0 g 0 —-1 .65  .08 —.16 —.73 
—.34 6.42 —.84 —.08 
y E —1 | 8 k À 
I2 2 “10 2 En los ejercicios 17 a 24, A es una matriz de m x n con una descom- 
posición en valores singulares A = USV", donde U es una matriz 
7 1 4 -—2 ortogonal de m x m, È es una matriz “diagonal” de m x n con r en- 
9.10 0 10. |2 —1 tradas positivas y sin entradas negativas, y V es una matriz ortogonal 
5 5 0 0 de n x n. Justifique sus respuestas. 
17. Suponga que A es cuadrada e invertible. Encuentre una des- 
11 E x 12 r i composición en valores singulares de A”!, 
6 -2 -=l 1 18. Demuestre que si A es cuadrada, entonces |det A| es el produc- 
5 to de los valores singulares de A. 


13. Encuentre la DVS de A = E 3 


2 . 
=9 | [Sugerencia: Tra- 19. Demuestre que las columnas de V son vectores propios de A7A, 


que las columnas de U son vectores propios de AA", y que las 
entradas diagonales de > son los valores singulares de A. [Suge- 
14. En el ejercicio 7, obtenga un vector unitario x en el cual Ax tiene rencia: Utilice la DVS para calcular ATA y AAT]. 

longitud máxima. 


baje con A7]. 


20. Demuestre que si A es una matriz positiva definida de n x n, 
15. Suponga que la siguiente factorización es una DVS de una ma- entonces una diagonalización ortogonal A = PDP” es una des- 
triz A, con las entradas en U y V redondeadas a dos decimales. composición en valores singulares de A. 
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21. 


22. 


23. 


24. 


25. 


Demuestre que si P es una matriz ortogonal de m x m, entonces 
PA y A tienen los mismos valores singulares. 


Justifique el enunciado del ejemplo 2 referente a que el segun- 
do valor singular de una matriz A es el máximo de ||Ax|| confor- 
me x varía sobre todos los vectores unitarios ortogonales a vı, 
siendo v; un vector singular derecho correspondiente al primer 
valor singular de A. [Sugerencia: Utilice el teorema 7 de la sec- 
ción 7.3]. 


Sean U = [uy -** u,] y V = [vi *** va], donde u, y v; son como 
en el teorema 10. Demuestre que 


A = ouv? + omv? +-+ + ou, vT 
Utilizando la notación del ejercicio 23, demuestre que 
A'u; = 0v; para l <j=<r= rango A. 


Sea T : R" > R” una transformación lineal. Describa cómo 
encontrar una base B para R” y una base C para R” tal que 
la matriz para T respecto de B y C sea una matriz “diagonal” 
de m x n. 


[M] Calcule una DVS para cada matriz en los ejercicios 26 y 27. 
Informe las entradas matriciales finales con dos decimales. Utilice 
el método de los ejemplos 3 y 4. 


—18 13 -—4 4 
2 19 —4 12 


A m -12 8 
—2 21 4 8 
6 -8 —4 5 —4 
2 7 —5 —6 4 
R AS 0 —1 -8 2 2 
-1 —2 4 4 -8 
28. [M] Determine los valores singulares de la matriz de 4 x 4 en 
el ejercicio 9 de la sección 2.3, y calcule el número de condi- 
ción o f / O4. 
29. [M] Calcule los valores singulares de la matriz de 5 x 5 en 


el ejercicio 10 de la sección 2.3, y determine el número de 
condición 01/05. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Si A = UX2V”, donde > es de m x n, entonces 47 = (V?)" E7U7 = VEU”. Esto es una 
DVS de A”, ya que V y U son matrices ortogonales y $" es una matriz “diagonal” de n x m. 
Como 5 y 5" tienen las mismas entradas diagonales diferentes de cero, A y A” tienen los 
mismos valores singulares distintos de cero. [Nota: Si A es de 2 x n, entonces A47 es solo 
de 2 x 2 y sus valores propios pueden ser más fáciles de calcular (a mano) que los valores 
propios de ATA]. 


7.5 | APLICACIONES AL PROCESAMIENTO DE IMÁGENES Y ESTADÍSTICA 


Las fotografías satelitales en la introducción del capítulo dan un ejemplo de datos mutidi- 
mensionales, o multivariados; es decir, se trata de información organizada de manera que 
cada dato en el conjunto de datos esté identificado con un punto (vector) en R”. El principal 
objetivo de esta sección es explicar una técnica, llamada análisis de componentes principales, 
empleada para analizar datos multivariados. Los cálculos ilustrarán el uso de la diagonaliza- 
ción ortogonal y la descomposición en valores singulares. 

El análisis de componentes principales es aplicable a cualquier conjunto de datos consis- 
tente en listas de mediciones realizadas a una colección de objetos o individuos. Por ejemplo, 
considere un proceso químico que produce un material plástico. Para monitorizar el proceso, 
se toman 300 muestras del material producido, y cada muestra se somete a una batería de 
ocho pruebas, tales como punto de fusión, densidad, ductilidad, resistencia a la tensión, etcé- 
tera. El informe del laboratorio para cada muestra es un vector en R$, y el conjunto de tales 
vectores forma una matriz de 8 x 300, llamada matriz de observaciones. 

En términos generales, se puede decir que los datos de control del proceso son octo- 
dimensionales. Los siguientes dos ejemplos describen datos que se pueden visualizar gráfi- 
camente. 


EJEMPLO 1 Un ejemplo de datos bidimensionales está dado por un conjunto de pesos 
y alturas de N estudiantes de licenciatura. Sea X; el vector de observaciones en R? que lista 
el peso y la altura del j-ésimo estudiante. Si w denota el peso y h la altura, entonces la matriz 


FIGURA 2 

Gráfica de dispersión de datos 
espectrales para una imagen 
satelital. 


> 


5> 


FIGURA 3 Datos de peso-altura en 
la forma de desviación media. 
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de observaciones tiene la forma 


wi Wa ... WN 
hı hz khi hy 
Xı X2 Xy 
El conjunto de vectores de observación se puede visualizar como una gráfica de dispersión 
bidimensional. Véase la figura 1. E 
h 





| w 


FIGURA 1 Una gráfica de dispersión de 
vectores de observaciones X¡,..., Xy. 


EJEMPLO 2 Las primeras tres fotografías del Valle Railroad, Nevada, que se presentan 
en la introducción al capítulo, se pueden ver como una imagen de la región, con tres compo- 
nentes espectrales, ya que se hicieron mediciones simultáneas de la región con tres distintas 
longitudes de onda. Cada fotografía da diferente información sobre la misma región física. 
Por ejemplo, el primer pixel en la esquina superior izquierda de cada fotografía correspon- 
de al mismo lugar sobre el suelo (aproximadamente 30 metros por 30 metros). Cada pixel se 
asocia con un vector de observaciones en R$ que lista las intensidades de la señal para ese 
pixel en las tres bandas espectrales. 

Por lo común, una imagen es de 2000 x 2000 pixeles, por lo que existen 4 millones de 
pixeles en la imagen. Los datos para la imagen forman una matriz con 3 filas y 4 millones 
de columnas (con las columnas arregladas en cualquier orden conveniente). En este caso, 
el carácter “multidimensional” de los datos se refiere a las tres dimensiones espectrales 
más que a las dos dimensiones espaciales que naturalmente pertenecen a cualquier foto- 
grafía. Los datos se pueden visualizar como un cúmulo de 4 millones de puntos en [R3, quizá 
como en la figura 2. E 


Media y covarianza 


Como preparación para el análisis de componentes principales, sea [X; <+: Xy] una matriz de 
observaciones de p x N, tal como la que se describió anteriormente. La media muestral, M, 
de los vectores de observaciones X¡,..., Xy está dada por 


M= : XX +: :+Xy) 
a N 
Para los datos de la figura 1, la media muestral es el punto en el “centro” de la gráfica de 
dispersión. Para k = 1,..., N, sea 
Å: =X, -M 
Las columnas de la matriz de p x N 
B=[X, X, Xy ] 


tienen una media muestral cero, y se dice que B está en la forma de desviación media. Cuan- 
do la media muestral se resta de los datos de la figura 1, la gráfica de dispersión resultante 
tiene la forma que se observa en la figura 3. 
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La matriz de covarianza (muestral) es la matriz S de p x p definida por 


1 
S = —— BB" 
N-1 
Como cualquier matriz de la forma BB” es positiva semidefinida, entonces S lo es. (Véase el 
ejercicio 25 de la sección 7.2 con B y B” intercambiadas). 


EJEMPLO 3 Se realizan tres mediciones en cada uno de los cuatro individuos en una 
muestra aleatoria de una población. Los vectores de observaciones son 


1 4 7 8 
X=|2|, X,= 21, X3=|8|, Xy=|4 
1 13 1 5 


Calcule la media muestral y la matriz de covarianza. 


SOLUCIÓN La media muestral es 


1 1 4 7 8 1 20 5 
M=- 2 |+ 2 1+18]|+/|4 =-|16|=]|4 
21 13 1 5 4130 5 
Restando la media muestral de X;,..., X4 se obtiene 
E —4 a —1 Ñ 2 E 3 
X=|-2| X=|-2|, X3= 4 |, X,=]|0 
—4 8 —4 0 
y 
—4 -1 2 3 
B=|-2 2 4 0 
-4 8-4 0 
La matriz de covarianza muestral es 
rs e 2 z E 
S=-=|2 2 4 0 
Ads Br A A 
3 0 0 
1 30 18 0 10 6 0 
=-|18 24 -24 | = 6 8 —8 E 
3| o -24 96 0 -8 32 


Para analizar las entradas en S = [s;;j], considere que X representa un vector que varía 
sobre el conjunto de vectores de observaciones y denote las coordenadas de X como x1,..., Xp. 
Entonces x;, por ejemplo, es un escalar que varía sobre el conjunto de las primeras coordena- 
das de X;,..., Xy. Para ¡ = 1,..., p, la entrada diagonal s¡¡ en S es la varianza de x;. 

La varianza de x; mide la dispersión de los valores de x;. (Véase el ejercicio 13). En el 
ejemplo 3, la varianza de x, es 10 y la varianza de x3 es 32. El hecho de que 32 sea mayor 
que 10 indica que el conjunto de las terceras entradas en los vectores de respuesta tiene una 
dispersión más amplia que el conjunto de las primeras entradas. 

La varianza total de los datos es la suma de las varianzas en la diagonal de S. En general, 
la suma de las entradas diagonales de una matriz cuadrada S se denomina traza de la matriz, 
y se representa como tr(S). Así, 


[varianza total] = tr(S) 
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La entrada s¡; de S para ¡ + ¡es la covarianza de x; y x;. Observe que en el ejemplo 3, 
la covarianza entre x, y x3 es O porque la entrada (1, 3) de S es 0. Los especialistas en esta- 
dística dicen que x, y x3 no están correlacionadas. El análisis de los datos multivariados en 
X¡,..., Xy se simplifica notablemente cuando la mayoría de las variables (o todas) x1,..., Xp 
no están correlacionadas, es decir, cuando la matriz de covarianza de X¡,..., Xy es diagonal 
O casi diagonal. 


Análisis de componentes principales 


Para simplificar, suponga que la matriz [X¡ -:: Xy] ya está en forma de desviación media. 
El objetivo del análisis de componentes principales es encontrar una matriz ortogonal de 
pxp,P = [uy -** u,] que determine un cambio de variable, X = PY, o 


X1 yı 
X2 y2 

= [u u2 u] . 
Xp Yp 


con la propiedad de que las nuevas variables y1,..., Yp no están correlacionadas y están en 
orden de varianza decreciente. 

El cambio ortogonal de variable X = PY significa que cada vector de observación Xy 
recibe un “nuevo nombre”, Y, tal que X} = PY}. Observe que Y, es el vector de coordena- 
das de X; con respecto a las columnas de P, y Y; = PX, =P"X; para k = 1,..., N. 

No es difícil comprobar que para cualquier P ortogonal, la matriz de covarianza de 
Y1,..., Yy es PTSP (ejercicio 11). Así, la matriz ortogonal P deseada es aquella que hace 
diagonal a PTSP. Sea D una matriz diagonal con los valores propios À1,..., Àp de S sobre 
la diagonal, ordenados de tal manera que À = M = + = Àp Z 0, y sea P una matriz orto- 
gonal cuyas columnas son los vectores propios unitarios correspondientes u;,..., U,. De esta 
forma, S = PDP" y PTSP = D. 

Los vectores propios unitarios u;,..., U, de la matriz de covarianza S se llaman compo- 
nentes principales de los datos (en la matriz de observaciones). La primera componente 
principal es el vector propio correspondiente al mayor valor propio de S, la segunda com- 
ponente principal es el vector propio asociado al segundo mayor valor propio, y así suce- 
sivamente. 

La primera componente principal u; determina la nueva variable yı de la siguiente 
manera. Sean Cy,..., Cp las entradas en u¡. Como ul es la primera fila de P”, entonces la 
ecuación Y = PTX indica que 


T 
yı =U X = cix + C2X2 +++ + CpXp 


Así, yı es una combinación lineal de las variables originales x1,..., Xp, utilizando como pe- 
sos las entradas en el vector propio u;. En forma similar, u2 determina la variable y2, y 
así sucesivamente. 


EJEMPLO 4 Los datos iniciales para la imagen multiespectral del Valle Railroad (ejem- 
plo 2) consistían en 4 millones de vectores en R?. La matriz de covarianza asociada es! 


2382.78 2611.84 2136.20 
S = | 2611.84 3106.47 2553.90 
2136.20 2553.90 2650.71 


l Los datos del ejemplo 4 y de los ejercicios 5 y 6 fueron proporcionados por Earth Satellite Corporation de 
Rockville, Maryland. 
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Encuentre las componentes principales de los datos, y liste la nueva variable determinada por 
la primera componente principal. 


SOLUCIÓN Los valores propios de S y las componentes principales asociadas (los vectores 
propios unitarios) son 


A = 7614.23 42 = 427.63 A3 = 98.10 
.5417 —.4894 .6834 

u = | .6295 u2 = | —.3026 uz = | -.7157 
5370 .8179 .1441 


Utilizando dos decimales para simplificar, la variable para la primera componente princi- 
pal es 


yı = .54x1 + .63x2 + .56x3 


Esta ecuación se utilizó para crear la fotografía d) en la introducción del capítulo. Las va- 
riables x1, x2, x3 son las intensidades de la señal en las tres bandas espectrales. Los valores 
de xı, convertidos a una escala de grises entre negro y blanco, produjeron la fotografía a). 
De manera similar, los valores de x2 y x3 generaron las fotografías b) y c), respectivamente. 
En cada pixel de la fotografía d), el valor en la escala de grises se calcula a partir de yı, una 
combinación lineal ponderada de x1, x2, x3. En este sentido, la fotografía d) “muestra” la pri- 
mera componente principal de los datos. E 


En el ejemplo 4, la matriz de covarianza para los datos transformados, utilizando las 
variables y1, y2, y3, es 


7614.23 0 0 
D = 0 427.63 0 
0 0 98.10 


Aunque D es evidentemente más sencilla que la matriz de covarianza original S, aún no es 
notorio el mérito de construir las nuevas variables. Sin embargo, las varianzas de las variable 
y1, y2, y3 aparecen sobre la diagonal de D, y sin duda la primer varianza en D es mucho mayor 
que las otras dos. Como se verá, este hecho permitirá verificar que, en esencia, los datos son 
unidimensionales más que tridimensionales. 


Reducción de la dimensión de datos multivariados 


El análisis de componentes principales es potencialmente valioso en aplicaciones donde la 
mayor parte de la variación, o el rango dinámico, en los datos se debe a variaciones en tan 
solo unas cuantas de las nuevas variables, y1,..., Yp- 

Es posible demostrar que un cambio ortogonal de variables, X = PY, no modifica la 
varianza total de los datos. (A grandes rasgos, esto es cierto porque la multiplicación por 
la izquierda por P no altera las longitudes de los vectores ni los ángulos entre ellos. Véase 
el ejercicio 12). Esto significa que si S = PDP”, entonces 


varianza total varianza total 
= =t1(D) =21+-::+4p 
de X1,..., Xp de y1,-.., Yp 
La varianza de y; es A, y el cociente A¡/tr(S) mide la fracción de la varianza total que se “ex- 
plica” o se “capta” con yj. 


EJEMPLO 5 Calcule los diversos porcentajes de varianza de los datos multiespectra- 
les de Valle Railroad que se muestran en las fotografías de las componentes principales, d), 
e), f), presentadas en la introducción del capítulo. 
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SOLUCIÓN La varianza total de los datos es 
tr(D) = 7614.23 + 427.63 + 98.10 = 8139.96 


[Verifique que este número también sea igual a tr(S)]. Los porcentajes de la varianza total 
explicados por las componentes principales son 


Primera componente Segunda componente Tercera componente 


14.2 427. .10 
sacd = 93.5% ica = 5.3% Ro = 1.2% 
8139.96 8139.96 8139.96 


En un sentido, el 93.5% de la información recopilada por Landsat para la región de Valle 
Railroad se presenta en la fotografía d), el 5.3% en e) y solamente el 1.2% restante en f). m 


Los cálculos del ejemplo 5 revelan que los datos prácticamente no tienen varianza en la 
tercera (nueva) coordenada. Todos los valores de y3 son cercanos a cero. Geométricamente, 
los puntos de datos están cercanos al plano y3 = 0, y sus ubicaciones se pueden determinar 
más o menos exactamente conociendo solo los valores de y; y y2. De hecho, y, también tiene 
una varianza relativamente pequeña, lo que significa que los puntos están aproximadamente 
sobre una recta, y los datos, en esencia, son unidimensionales. Véase la figura 2, en la que los 
datos semejan un palo de paleta. 


Caracterizaciones de las variables de componentes 
principales 


Si y1,-.., Jp Se originan de un análisis de componentes principales de una matriz de observa- 
ciones de p x N, entonces la varianza de y, es tan grande como sea posible en el siguiente 
sentido: si u es cualquier vector unitario y si y = uX, entonces la varianza de los valores de 
y cuando X varía sobre los datos originales X¡,..., Xy es u'Su. De acuerdo con el teorema 8 
de la sección 7.3, el valor máximo de u”Su, sobre todos los vectores unitarios u, es el mayor 
valor propio A; de S, y esta varianza se alcanza cuando u es el vector propio correspondien- 
te u;. De manera similar, el teorema 8 indica que y, tiene la máxima varianza posible entre 
todas las variables y = uX que no están correlacionadas con y,. De igual forma, yz tiene 
la máxima varianza posible entre todas las variables no correlacionadas con y; y y2, y así 
sucesivamente. 


NOTA NUMÉRICA 





La descomposición en valores singulares es la herramienta más importante para efectuar 
el análisis de componentes principales en aplicaciones prácticas. Si B es una matriz de 
observaciones de p x N en la forma de desviación media, y si A = (1 INN — 1)B T; 
entonces ATA es la matriz de covarianza, S. Los cuadrados de los valores singulares de 
A son los p valores propios de S, y los vectores singulares derechos de A son las com- 
ponentes principales de los datos. 


Como se mencionó en la sección 7.4, el cálculo iterativo de la DVS de A es más 
rápido y preciso que una descomposición de valores propios de S. Esto es particu- 
larmente cierto, por ejemplo, en el procesamiento de imágenes hiperespectrales (con 
p = 224) que se mencionó en la introducción del capítulo. El análisis de componentes 
principales se completa en segundos en estaciones de trabajo especializadas. 


Lectura adicional 


Lillesand, Thomas M. y Ralph W. Kiefer, Remote Sensing and Image Interpretation, 4a. ed. 
(Nueva York: John Wiley, 2000). 


430 CAPÍTULO 7 Matrices simétricas y formas cuadráticas 


7. 


PROBLEMAS DE PRÁCTICA 


La siguiente tabla lista los pesos y las estaturas de cinco jóvenes: 


Joven| #1 #2 #3 #4 #5 





Peso (lb) 


120 125 125 135 145 








Altura (in) 61 60 64 68 7 


1. Encuentre la matriz de covarianza para los datos. 


2. Realice un análisis de componentes principales de los datos para encontrar un solo índice 
de tamaño que explique la mayor parte de la variación en los datos. 


5 EJERCICIOS 


En los ejercicios 1 y 2, convierta la matriz de observaciones a la 
forma de desviación media y construya la matriz de covarianza de 
la muestra. 


1. 


2. 


8. 


19 2 6 3 2 20 
12 6 9 15 13 5 


1 5 2 6 7 3 
3 1 6 8 15 11 


Encuentre las componentes principales de los datos del ejer- 
cicio 1. 


Encuentre las componentes principales de los datos del ejerci- 
cio 2. 


[M] Se tomó una imagen Landsat con tres componentes es- 
pectrales de la base Homestead de la Fuerza Aérea, en Florida 
(después de que la base sufrió los estragos provocados por el 
huracán Andrew en 1992). La matriz de covarianza de los datos 
se muestra a continuación. Determine la primera componente 
principal de los datos, y calcule el porcentaje de la varianza total 
que está contenida en esa componente. 


164.12 32.73 81.04 
S = 32.73 539.44 249.13 
81.04 249.13 189.11 


[M] La siguiente matriz de covarianza se obtuvo de una imagen 
Landsat del río Columbia, Washington, utilizando datos de tres 
bandas espectrales. Sean x1, x2, x3 las componentes espectrales 
de cada pixel en la imagen. Encuentre una nueva variable de la 
forma y, = C1X1 + C2x2 + c3X3 que tenga la máxima varianza po- 
sible, sujeta a la restricción c? + c? + c? = 1. ¿Qué porcentaje 
de la varianza total en los datos se explica mediante y? 


29.64 18.38 5.00 
S = | 18.38 20.82 14.06 
5.00 14.06 29.21 


Sean xı, x2 las variables para los datos bidimensionales del 
ejercicio 1. Determine una nueva variable y; de la forma 
Y1 = Cc1x1 + c2x2, con c? + e = l, tal que yı tenga la má- 
xima varianza posible sobre los datos proporcionados. ¿Qué 
parte de la varianza en los datos se explica por y? 


Repita el ejercicio 7 para los datos del ejercicio 2. 


10. 


11. 


12. 


13. 


Suponga que se aplican tres pruebas a una muestra aleatoria 
de estudiantes de licenciatura. Sean X;,..., Xy los vectores de 
observaciones en R? que listan las tres calificaciones de cada 
estudiante, y para j = 1, 2, 3, denote con x; la calificación de 
un estudiante en el j-ésimo examen. Suponga que la matriz 
de covarianza de los datos es 


5. 2 0 
Ss=|2 6 2 
O) 0:2n 57 
Sea y un “índice” de desempeño de estudiantes, con y = cx; + 


Cax2 + c3x3 y C? +c? +c? = 1. Seleccione c1, c2, c3 de ma- 
nera que la varianza de y sobre el conjunto de datos sea lo más 
grande posible. [Sugerencia: Los valores propios de la matriz de 
covarianza de la muestra son A = 3, 6 y 9]. 


5 4 2 
[M] Repita el ejercicio 9 con S = | 4 11 4 
2 4 5 
A partir de los datos multivariados X;,..., Xy (en RP) en la 


forma de desviación media, sea P una matriz de p x p, y defina 

Y, = PX; para k = 1,..., N. 

a) Demuestre que Y ,..., Y y están en la forma de desviación 
media. [Sugerencia: Deje que w sea el vector en RY con un 


1 en cada entrada. Entonces [X¡ -** Xy ]w = 0 (el vector cero 
en R»)]. 


b) Demuestre que si la matriz de covarianza de X¡,..., Xyes S, 
entonces la matriz de covarianza de Y ,,..., Yy es P7SP. 


Sea X un vector que varía sobre las columnas de una matriz de 
observaciones de p x N, en tanto que P es una matriz ortogonal 
de p x p. Demuestre que el cambio de variable X = PY no cam- 
bia la varianza total de los datos. [Sugerencia: De acuerdo con 
el ejercicio 11, es suficiente demostrar que tr(P7 SP) = tr(S). 
Utilice una propiedad de la traza mencionada en el ejercicio 25 
de la sección 5.4]. 


La matriz de covarianza de la muestra es una generalización de 
una fórmula para la varianza de una muestra de N mediciones 
escalares, por ejemplo, t1,..., ty. Si m es el promedio de t1,..., ty, 
entonces la varianza de la muestra está dada por 


1 n 
9 (Mm) (1) 
N-I 
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Muestre cómo la matriz de covarianza de la muestra, S, defini- nadas para escribir a $ como 1/(N — 1) por la suma de N ma- 
da antes del ejemplo 3, se puede escribir en una forma similar trices de tamaño p x p. Para 1 S k < N, escriba X; — M en vez 
a (1). [Sugerencia: Utilice multiplicación de matrices particio- de Xy]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Primero arregle los datos en la forma de desviación media. Es fácil ver que el vector de la 


130 


65 f Reste M de los vectores de observaciones (las columnas 


media muestral es M = | 


de la tabla) y obtenga 


se 5 E 
s= zp 3 2] 


Entonces la matriz de covarianza de la muestra es 


-10 —4 

gad Ea -5 -5 5 da] E a 
5-=1| 4 -5-1 3 7 T 
15 7 


1 400 19 | [100.0 47.5 
4| 190 100 |" | 475 25.0 


2. Los valores propios de S son (con dos decimales) 


à = 123.02 y M= 1.98 


; EN 900 y 
El vector propio unitario a À; es u = | 436 | (Como S es de 2 x 2, los cálculos se pue- 
den hacer a mano si no se cuenta con un programa de matrices). Para el índice de tamaño, 
sea 


y = .900% + .436h 


donde v y h son el peso y la altura, respectivamente, en la forma de desviación media. 
La varianza de este índice sobre el conjunto de datos es 123.02. Puesto que la varianza 
total es tr(S) = 100 + 25 = 125, el índice de tamaño explica prácticamente toda la va- 
rianza de los datos (el 98.4% de esta). 

La figura 4 muestra los datos originales para el problema de práctica 1 y la recta 
determinada por la primera componente principal u. (En forma vectorial paramétrica, la 
recta es x = M + tu). Es posible demostrar que la recta es la mejor aproximación a los 


h 
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FIGURA 4 Una recta de regresión ortogonal determinada por 
la primera componente principal de los datos. 
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datos, en el sentido de que la suma de los cuadrados de las distancias ortogonales a la 
recta se minimiza. En efecto, el análisis de componentes principales es equivalente a 
la regresión ortogonal, pero eso es otra historia. Quizá se presente otra vez. 


CAPÍTULO 7 EJERCICIOS COMPLEMENTARIOS 


1. 


Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. En cada inciso, A representa una matriz de n x n. 


a) Si A es diagonalizable ortogonalmente, entonces A es si- 
métrica. 


b) Si A es una matriz ortogonal, entonces A es simétrica. 


c) Si A es una matriz ortogonal, entonces ||Ax|| = ||x|| para 
toda x en R”. 


d) Los ejes principales de una forma cuadrática x"Ax pueden 
ser columnas de cualquier matriz P que diagonaliza a A. 


e) Si P es una matriz de n x n con columnas ortogonales, en- 
tonces PT = P”!, 


P) 


Si todo coeficiente en una forma cuadrática es positivo, 
entonces la forma cuadrática es definida positiva. 


2) Si x"Ax > 0 para alguna x, entonces la forma cuadrática 
x'Ax es positiva definida. 


h) Con un cambio adecuado de variable, cualquier forma 
cuadrática se puede convertir en una forma cuadrática sin 
productos cruzados. 


i) El valor más grande de una forma cuadrática x”Ax, para 
|x| = 1, es la entrada más grande en la diagonal de A. 


Jj) El valor máximo de una forma cuadrática positiva definida 
x"Ax es el mayor valor propio de A. 


k) Una forma cuadrática positiva definida se puede convertir 
en una forma negativa definida mediante un adecuado cam- 
bio de variable x = Pu, para alguna matriz ortogonal P. 


1) Una forma cuadrática indefinida es aquella cuyos valores 
propios no están definidos. 


m) Si P es una matriz ortogonal de n x n, entonces el cambio 
de variable x = Pu convierte x"Ax en una forma cuadrá- 
tica cuya matriz es P7!AP. 


n) Si U es de m x n con columnas ortogonales, entonces UUTx 
es la proyección ortogonal de x sobre Col U. 


o) Si B es de m x n y x es un vector unitario en R”, entonces 
||Bx|| = c1, donde c; es el primer valor singular de B. 


p) Una descomposición en valores singulares de una matriz B 
de m x n se puede escribir como B = PX.O, donde P es una 
matriz ortogonal de m x m, Q es una matriz ortogonal de 
n x n, y È es una matriz “diagonal” de m x n. 


q) Si A es den x n, entonces A y ATA tienen los mismos valores 
singulares. 


Sean {u;,..., Un} una base ortonormal para R”, y À1,..., Àn 
cualesquiera escalares reales. Defina 


A = uu? +- +24,0,u7 


a) Demuestre que A es simétrica. 


b) Pruebe que Ay,..., A, son los valores propios de A. 


Sea A una matriz simétrica de n x n y rango r. Explique por 
qué la descomposición espectral de A representa a esta como 
la suma de r matrices de rango 1. 


Sea A una matriz simétrica de n x n. 


a) Demuestre que (Col A)+ = 
sección 6.1]. 


Nul A. [Sugerencia: Véase la 


b) Demuestre que cada y en R” se puede escribir en la forma 
y =$ +z, con f en Col A y zen Nul A. 


Demuestre que si y es un vector propio de una matriz A de 
n x n, y v corresponde a un valor propio de A distinto de cero, 
entonces v está en Col A. [Sugerencia: Utilice la definición 
de un vector propio]. 


Sea A una matriz simétrica de n x n. Aplique el ejercicio 5 y una 
base de vectores propios en R” con la finalidad de dar una se- 
gunda demostración de la descomposición en el ejercicio 4b). 


Demuestre que una matriz A de n x n es positiva definida si y solo 
si A admite una factorización de Cholesky, a saber, A = RTR 
para alguna matriz triangular superior invertible R cuyas en- 
tradas diagonales son todas positivas. [Sugerencia: Utilice una 
factorización QR y el ejercicio 26 de la sección 7.2]. 


Con base en el ejercicio 7, demuestre que si A es positiva defi- 
nida, entonces A tiene una factorización LU, A = LU, donde U 
tiene pivotes positivos en su diagonal. (Lo contrario también es 
verdadero). 


Si A es de m x n, entonces la matriz G = ATA es la matriz de Gram 
de A. En este caso, las entradas de G son los productos interiores de 
las columnas de A. (Véase los ejercicios 9 y 10). 


9. 


10. 


11. 


Demuestre que la matriz de Gram de cualquier matriz A es 
positiva semidefinida, con el mismo rango que A. (Véase los 
ejercicios de la sección 6.5). 


Demuestre que si una matriz G de n x n es positiva semidefinida 
y tiene rango r, entonces G es la matriz de Gram de alguna ma- 
triz A de r x n. Esto se llama factorización reveladora del rango 
de G. [Sugerencia: Considere la descomposición espectral de G, 
y primero escriba G como BB” para una matriz B de n x r]. 


Pruebe que cualquier matriz A de n x n, admite una descomposi- 
ción polar de la forma A = PQ, donde P es una matriz positiva 
semidefinida con el mismo rango que A, y donde Q es una ma- 
triz ortogonal de n x n. [Sugerencia: Utilice la descomposición 
en valores singulares, A = UX2V7, y observe que A = (UXU7) 
(UV?)]. Esta descomposición se utiliza, por ejemplo, en inge- 
niería mecánica para modelar la deformación de un material. La 
matriz P describe la elongación o compresión del material (en 
las direcciones de los vectores propios de P), y O describe la 
rotación del material en el espacio. 


Los ejercicios 12 a 14 se refieren a una matriz A de m x n con una 
descomposición en valores singulares reducida, A = U, DV‘, y la 
seudoinversa A+ = V,DUf. 


12. Compruebe las propiedades de A+: 





a) Para toda y en [R”, AA*y es la proyección ortogonal de y 
sobre Col A. 


b) Para toda x en R”, A*Ax es la proyección ortogonal de x 
sobre Fil A. 


c) AAA =A y AAA = A*t 











13. Suponga que la ecuación Ax = b es consistente, y sea x? = 
A*b. De acuerdo con el ejercicio 23 de la sección 6.3, existe 
exactamente un vector p en Fil A tal que Ap = b. Los siguientes 
pasos prueban que x* = p y x* es la solución de longitud míni- 
ma de Ax = b. 


a) Demuestre que x* está en Fil A. [Sugerencia: Escriba b 
como Ax para alguna x, y utilice el ejercicio 12]. 


b) Demuestre que x* es una solución de Ax = b. 


c) Demuestre que si u es cualquier solución de Ax = b, enton- 
ces l|x*|| <= llull, con la igualdad solo si u = x?. 
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14. Dada cualquier b en [R”, adapte el ejercicio 13 para demostrar 
que A*b es la solución por mínimos cuadrados de longitud mí- 
nima. [Sugerencia: Considere la ecuación Ax = b, donde bh es 
la proyección ortogonal de b sobre Col A]. 


[M] En los ejercicios 15 y 16, construya la seudoinversa de A. 
Comience aplicando un programa de matrices para obtener la DVS 
de A, o, si no tiene un programa de ese tipo, comience con una dia- 
gonalización ortogonal de A7A. Utilice la seudoinversa para resolver 
Ax = b, para b = (6, —1, —4, 6), y seaX la solución. Haga un cálculo 
para comprobar que X está en Fil A. Encuentre un vector u distinto de 
cero en Nul A, y compruebe que [|X|| < ||X + ull, lo que debe ser cierto 
de acuerdo con el ejercicio 13c). 








33 6 6 1 


-=1 -1 -—1 1 —2 

Doac 0 0 -i 1 —1 
0 0 —1 1 —1 

4 0-1 2 0 

5 0 3 5 0 

1 2 0-12 0 
6 0 -3 —6 0 
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Geometría de espacios 


vectoriales 


EJEMPLO INTRODUCTORIO 


Los sólidos platónicos 


En la ciudad de Atenas, en el año 387 a. C., el filósofo griego 
Platón fundó una Academia, a la que muchos consideran 
como la primera universidad en el mundo. Aunque ahí 

se estudiaban ciencias como astronomía, biología, teoría 
política y filosofía, el tema fundamental de estudio fue la 
geometría. En efecto, a la entrada de la Academia se leía 

la inscripción: No entre aquí quien no sepa geometría. 


Los griegos quedaron muy impresionados por los 
patrones geométricos, como los sólidos regulares. 
Un poliedro se llama regular si sus caras son polígonos 
regulares congruentes y todos los ángulos en los vértices 
son iguales. Cerca de 150 años antes de Euclides, los 
pitagóricos conocían al menos tres sólidos regulares: 
el tetraedro (4 caras triangulares), el cubo (6 caras 
cuadradas) y el octaedro (8 caras triangulares). (Véase la 
figura 1). Esas formas se presentan de manera natural en 
cristales de minerales comunes. Solo existen cinco de estos 
sólidos regulares; a los ya mencionados hay que añadir el 
dodecaedro (12 caras pentagonales) y el icosaedro (20 caras 
triangulares). 


En el Libro xmm de sus Elementos, Platón analizó la 
teoría básica de esos cinco sólidos, y desde entonces se 


les conoce con el nombre de sólidos platónicos. 


Durante siglos no hubo necesidad de considerar objetos 
geométricos de más de tres dimensiones. Pero en la actualidad 





es común que los matemáticos trabajen con objetos en 
espacios vectoriales de cuatro, cinco o incluso cientos de 
dimensiones. No necesariamente son claras las propiedades 
geométricas que pudieran atribuirse a esos objetos de 
grandes dimensiones. 


Por ejemplo, ¿qué propiedades tienen las rectas en espacios 
bidimensionales y los planos en espacios tridimensionales? 
¿Cuáles de esas propiedades podrían ser útiles en mayores 
dimensiones? Las secciones 8.1 y 8.4 presentan algunas 
respuestas. Los hiperplanos de la sección 8.4 serán importantes 
para entender la naturaleza multidimensional de los problemas 
de programación lineal. 


¿A que “se parecería” el análogo de un poliedro en más 
de tres dimensiones? Se obtiene una respuesta parcial con las 
proyecciones bidimensionales del objeto tetradimensional, 
creadas de manera análoga a las proyecciones bidimensionales 
de un objeto tridimensional. La sección 8.5 ilustra esta idea 
para el “cubo” y el “simplejo” de cuatro dimensiones. 


El estudio geométrico en grandes dimensiones no solo 
aporta nuevas formas de visualizar conceptos algebraicos 
abstractos, sino que también genera herramientas aplicables 
en R?. Por ejemplo, las secciones 8.2 y 8.6 incluyen aplica- 
ciones a gráficos de computadora, y en la sección 8.5 se 
delinea una demostración (en el ejercicio 21) de que en R? 
solo existen cinco poliedros regulares. 
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FIGURA 1 Los cinco sólidos platónicos. 


En los capítulos anteriores, la mayoría de las aplicaciones implicaron cálculos algebraicos 
con subespacios y combinaciones lineales de vectores. Este capítulo estudia conjuntos de 
vectores que se pueden visualizar como objetos geométricos, segmentos de recta, polígonos 
y objetos sólidos. Los vectores individuales se ven como puntos. Los conceptos que se pre- 
sentan en este capítulo se emplean en gráficos de computadora, en programación lineal y en 
otras áreas de matemáticas.' 

A lo largo del capítulo, los conjuntos de vectores se describen mediante combinaciones 
lineales, pero con diferentes restricciones acerca de los pesos utilizados en dichas combina- 
ciones. Por ejemplo, en la sección 8.1, la suma de los pesos es 1, mientras que en la sección 
8.2, los pesos son positivos y suman 1. Desde luego, las visualizaciones son en R? o Rô, pero 
los conceptos también se aplican a R” y a otros espacios vectoriales. 


8.1 | COMBINACIONES AFINES 


Una combinación afín de vectores es un tipo especial de combinación lineal. Dados los 
vectores (o “puntos”) v1, V2,..., Vp en R” y los escalares c1,..., Cp, una combinación afín 
de vı, V2,..., Vp es una combinación lineal 


C1V1 E *** + CpVp 


tal que los pesos satisfacen c1 + *** + cp = 1. 


l Véase Foley, Van Dam, Feiner y Hughes, Computer Graphics-Principles and Practice, 2a. edición (Boston: 
Addison-Wesley, 1996), pp. 1083-1112. Este material también analiza “espacios afines” sin coordenadas. 
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DEFINICIÓN El conjunto de todas las combinaciones afines de puntos en un conjunto S es la envol- 
vente afín (o el afín generado) de S, y se denota como aff S. 


La envolvente afín de un solo punto v; es justamente el conjunto {v1}, ya que tiene la 
forma cıvı, donde cı = 1. Es frecuente que la envolvente afín de dos puntos distintos se 
escriba de manera especial. Suponga que y = cıVı + c2V2 con cı + c2 = 1. Se escribe £ en 
lugar de c2, de manera que cı = 1 — c2 = 1 — t. Entonces, la envolvente afín de {v1, v2} 
es el conjunto 


y= (1 — t)vı + tv, conten R (1) 


Este conjunto de puntos incluye a v; (cuando £ = 0) y a vz (cuando £ = 1). Si v, = v1, entonces 
la ecuación (1) nuevamente describe solo un punto. En otras palabras, (1) describe la recta 
que pasa por v; y v2. Para ver esto, se rescribe (1) en la forma: 


y=v¡+1H(v2—v1)=p+!u, contenkR 


donde p es v; y u es v2 — v1. El conjunto de todos los múltiplos de u es Gen {u}, la recta que 
pasa por u y por el origen. El hecho de sumar p a cada punto sobre esta recta traslada Gen {u} 
a la recta que pasa por p paralela a la recta que pasa por u y por el origen. Véase la figura 1. 
(Compare esta figura con la número 5 de la sección 1.5). 








FIGURA 1 


La figura 2 utiliza los puntos originales vı y v2, y muestra aff{ v1, V2} como la recta que 
pasa por vı y v2. 


. 
a 


1 UV, V1) 








FIGURA 2 


Observe que mientras que el punto y en la figura 2 es una combinación afín de v; y vo, 
el punto y — v; es igual a t(v> — v¡), que es una combinación lineal (de hecho, un múltiplo) 
de v2 — vı. Esta relación entre y y y — v, es válida para cualquier combinación afín de 
puntos, como lo indica el siguiente teorema. 


TEOREMA 1 Un punto y en R” es una combinación afín de v;,..., v, en R” si y solo si y — v, es una 
combinación lineal de los puntos trasladados vz — Vj,..., Vp — V1- 
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DEMOSTRACIÓN Si y — v¡ es una combinación lineal de v2 — v1,..., Vp — V1, entonces 
existen pesos c>,..., Cp tales que 
y —= Vi =C2(V2— V1) +++ +Cp(vp — Vi) 2) 
Luego, 
y = (1 —c7 —***—Cp)V1 + C2V2 ++" +CpVp 6) 


y los pesos en esta combinación lineal suman 1. Así, y es una combinación afín de vj,..., Vp. 
A la inversa, suponga que 


Y = C1V1 + C2V2 +++ +CpVp (4) 
donde cı + =+ + cp = 1. Como cı = 1 — c, — *** — Cp, entonces la ecuación (4) se puede 
escribir como en la ecuación (3), y esto conduce a (2), lo que demuestra que y — V; es una 
combinación lineal de vz — V;,..., Vp — V1- E 


En el enunciado del teorema 1, el punto v, se podría remplazar por cualquier otro punto 
de la lista v1,..., Vp. En la demostración solo cambiaría la notación. 


EJEMPLO 1 Sean vı = BE z [zl Z [ahus al ys Ml Sid 


posible, escriba y como una combinación afín de v1, V2, V3 Y Va. 


SOLUCIÓN Se calculan los puntos trasladados 


1 0 —3 3 
Bl] oo) 


Se encuentran los escalares c2, c3 y c4 tales que 
Ca( va — V1) + C3(V3 — V1) + Calva — VI) = y — V1 (5) 
ahora se reduce por filas la matriz aumentada teniendo estos puntos como columnas: 
1. 0-3 3 1 0 -3 3 
3 1 0 -l 0 1 9-10 
Esto demuestra que la ecuación (5) es consistente, y la solución general es cz = 3c4 + 3, 
c3 = —9c4 — 10, con c4 libre. Cuando c4 = 0, 


y — vi = 3(v2 — v1) — 10(v3 — vı) + O(v4 — v1) 


y 
y = 8v1 + 3v2— 10v3 
Como otro ejemplo, se toma c4 = 1. Entonces, cz = 6 y c3 = — 19, así que 
y — vi = 6(v2 — V1) — 19(v3 — v1) + 1va— vi) 
y 


y = 13v¡ + 6v2— 19v3 + va A 


Mientras que el procedimiento del ejemplo 1 funciona para puntos arbitrarios v;, 
v>,..., Vp en RR”, la pregunta se puede contestar más directamente si los puntos selecciona- 
dos v; son una base para R”. Por ejemplo, sea B = (bj,..., b,) dicha base. Entonces cual- 
quier y en R” es una combinación lineal única de bj,..., b,. Esta combinación es una 
combinación afín de las b si y solo si los pesos suman 1. (Estos pesos son justamente las 
B-coordenadas de y, como en la sección 4.4). 


DEFINICIÓN 


TEOREMA 2 
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4 0 5 2; 1 
EJEMPLO 2 Sean bi=|0|,bb»=|4|,b3=|2|,p,=|0| y p=|2|l. 
3 2 4 0 2 


El conjunto 5 = {b;, b2, b3} es una base para R3. Determine si los puntos pı y p2 son 
combinaciones afines de los puntos en B. 


SOLUCIÓN Encuentre las B-coordenadas de p, y p». Estos dos cálculos se pueden combi- 
nar reduciendo por filas la matriz [b; b2 b3 pı p2], con dos columnas aumentadas: 


2 

4 0 5 2 1 1 0 0-2 35 
0.4 2 0 2|=[0 1 0-1 ż 
3 2 4 0 2 
07-05) dd 


Lea la columna 4 para construir py, y la columna 5 para construir po: 


Pp, =-2b¡—b2+2b3 y p,=3b1+3b2— 3b; 


La suma de los pesos en la combinación lineal para p; es —1, no 1, de manera que p; no 
es una combinación afín de las b. Sin embargo, p, es una combinación afín de las b porque 
la suma de los pesos para p, es 1. E 


Un conjunto S es afín si p, q e S implica que (1 — £)p + tq €e S para todo número 
real £. 


Geométricamente, un conjunto es afín si siempre que dos puntos estén en el conjunto, la 
recta completa que pasa por esos puntos también está en el conjunto. (Si S solamente contiene 
un punto, p, entonces la recta pasa por p y p es justamente un punto, una recta “degenerada”). 
Algebraicamente, para que un conjunto S sea afín, la definición requiere que cada combina- 
ción afín de dos puntos de S pertenezca a S. De manera notable, esto es equivalente a pedir 
que S contenga toda combinación afín de un número arbitrario de puntos de S. 


Un conjunto S es afín si y solo si cada combinación afín de puntos de S está en S. 
Es decir, S es afín si y solo si S = aff S. 


DEMOSTRACIÓN Se supone que S es afín y se utiliza inducción sobre el número m de 
puntos de S que participan en una combinación afín. Cuando m es 1 o 2, una combinación 
afín de m puntos de S se encuentra en S, de acuerdo con la definición de conjunto afín. 
Ahora, se supone que cada combinación afín de k o menos puntos de $ conducen a un punto 
en S, y se considera una combinación de k + 1 puntos. Tomemos v; en S para i = 1,..., k + 
1, y sea y = cV + +e + CkVk + Ck+1Vk+1, donde cy + ++ + cg+1 = 1. Como las c; suman 1, 
al menos una de ellas no debe ser igual a 1. Al reindexar las v; y las c;, si es necesario, se 
puede suponer que cg+1 # 1. Sea t = cı + + + cp. Entonces t = 1 — cg+1 £ 0, y 


C1 Ck 
y = (l — Ck41) (En ii ve) + Ck+1Vk+1 (6) 


De acuerdo con la hipótesis de inducción, el punto z = (c1/)vı + + + (c;/1)vz está 
en S, ya que los coeficientes suman 1. De esta forma, (6) presenta a y como una combina- 
ción afín de dos puntos en S, y así y e S. De acuerdo con el principio de inducción, cada 
combinación afín de dichos puntos está en S. Es decir, aff S C S. Pero la inclusión inversa, 
S C aff S, siempre se aplica. Por lo tanto, cuando S es afín, S = aff S. A la inversa, si 
S = aff S, entonces las combinaciones afines de dos (o más) puntos de S están en S, por 
consiguiente, S es afín. E 
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DEFINICIÓN 


TEOREMA 3 


La siguiente definición aporta terminología para conjuntos afines que pone de relieve 
su cercana relación con subespacios de [R”. 


Un traslado de un conjunto S en R” por un vector p es el conjunto S$ + p = {s + 
p : s e S}? Un plano afín en R” es un traslado de un subespacio de R”. Dos planos 
afines son paralelos si uno es el traslado del otro. La dimensión de un plano afín es la 
dimensión del subespacio paralelo correspondiente. La dimensión de un conjunto S, 
escrito como dim S, es la dimensión del plano afín más pequeño que contiene a S. 
Una recta en R” es un plano afín de dimensión 1. Un hiperplano en R” es un plano 
afín de dimensión n — 1. 


En RR?, los subespacios propios” consisten en el origen 0, el conjunto de todas las líneas 
que pasan por 0, y el conjunto de todos los planos que pasan por 0. Así, los planos afines 
propios en [R3 son puntos (dimensión cero), rectas (unidimensionales) y planos (bidimensio- 
nales), los cuales pueden pasar o no por el origen. 

El siguiente teorema indica que esas descripciones geométricas de rectas y planos en 
R? (como traslados de subespacios) en realidad coinciden con sus anteriores descripciones 
algebraicas como conjuntos de todas las combinaciones afines de dos o tres puntos, respec- 
tivamente. 


Un conjunto S no vacío es afín si y solo si es un plano afín. 


DEMOSTRACIÓN Supongamos que S es afín. Sea p cualquier punto fijo en S, y W = S + 
(—p), de manera que S = W + p. Para demostrar que S es un plano afín, es suficiente de- 
mostrar que W es un subespacio de R”. Puesto que p está en S, el vector cero está en W. Para 
demostrar que W es cerrado bajo sumas y múltiplos escalares, basta con probar que si u; y u2 
son elementos de W, entonces u; + tw está en W para cada ż real. Como u; y w están en W, 
existen sı y s2 en S tales que u; = sı — p y W = $2 — Pp. Así, para cada t real, 


u; + tu = (sı — p) + t (s2 — p) 
= (1 —1)s, + 1(S; +82 —Pp)-Pp 


Sea y = sı + s2 — p. Entonces y es una combinación afín de puntos en S. Como S es afín, 
y está en S (de acuerdo con el teorema 2). Pero entonces (1 — £)s¡ + ty también está en S. 
Así, u; + tw está en —p + S = W. Esto demuestra que W es un subespacio de R”. Por lo 
tanto, S es un plano afín, porque S = W + p. 

A la inversa, suponga que S es un plano afín. Es decir, § = W + p para alguna p e R” 
y algún subespacio W. Para probar que S es afín, es suficiente demostrar que para cualquier 
par de puntos sı y s2 en S, la recta que pasa por sı y s2 está en S. Por definición de W, existen 
u; y u en W tales que sı = u; + p y s2 = w + p. Así, para cada 1 real, 


(1 —t)sı + ts2 = (1 — t) (u: + p) + t% + p) 
= (1 — tju; + tw +p 


Como W es un subespacio, (1 — u; + tu e W y así (1 — 1)s¡ + ts2 € W + p = S. Por lo 
tanto, S es afín. E 


2 Si p = 0, entonces el traslado es S mismo. Véase la figura 4 de la sección 1.5. 
3 Un subconjunto A de un conjunto B es un subconjunto propio de B si A + B. La misma condición se aplica a sub- 
espacios propios y planos afines propios en R”: no son iguales a R”. 





FIGURA 3 


DEFINICIÓN 


TEOREMA 4 
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El teorema 3 ofrece un enfoque geométrico para la envolvente afín de un conjunto: es 
el plano afín que consiste en todas las combinaciones afines de puntos en el conjunto. Por 
ejemplo, la figura 3 muestra los puntos estudiados en el ejemplo 2. Aunque el conjunto de 
todas las combinaciones lineales de b;, b» y b3 es todo de RÍ, el conjunto de todas las com- 
binaciones afines es solamente el plano a través de bı, b2 y b3. Observe que p2 (del ejem- 
plo 2) está en el plano por bı, b2 y b3, mientras que pı no se encuentra en ese plano. También, 
véase el ejercicio 14. 

El siguiente ejemplo ofrece una mirada renovada a un conjunto familiar: el conjunto de 
todas soluciones de un sistema Ax = b. 


EJEMPLO 3 Suponga que las soluciones de una ecuación Ax = b son todas de la forma 


2 4 
x = xu + p, donde u = | —3 |y p= 0 |. De la sección 1.5 recuerde que este con- 
1 —3 


junto es paralelo al conjunto solución de Ax = 0, que consiste en todos los puntos de la forma 
x3U. Encuentre puntos vı y v2 tales que el conjunto solución de Ax = b sea aff {v1, v2}. 


SOLUCIÓN El conjunto solución es una recta que pasa por p en la dirección de u, como 
se muestra en la figura 1. Como aff{v1, v2} es una recta que pasa por vı y v2, identifique 
dos puntos sobre la recta x = x3u + p. Se presentan dos sencillas elecciones cuando x3 = 0 
y x3 = 1. Es decir, tome vı = p y v2 = u + p, de forma que 


2 4 6 
v=u+p=|—3|+ 0|=]|-3 
1 —3 —2 


En este caso, el conjunto solución se describe como el conjunto de todas las combinaciones 
afines de la forma 


4 6 
x=(l-x3)| 0|+x3| -3 E 
—3 —2 


Anteriormente, el teorema 1 reveló una importante conexión entre combinaciones afines y 
combinaciones lineales. El siguiente teorema ofrece otra perspectiva de las combinaciones afi- 
nes, que para R? y R? está cercanamente relacionada con aplicaciones a gráficos generados por 
computadora, como se explicará en la siguiente sección (y como se vio en la sección 2.7). 


4 3 z v 
Para v en R”, la forma homogénea estándar de v es el punto Y = | 1 | en R+, 


Un punto y en R” es una combinación afín de vı,..., Vp en R” si y solo si la for- 
ma homogénea de y está en Gen (Vi,..., Vp). De hecho, y = cıVı + +: + CpYp, con 
a Sy SOLO SY CV CON y: 


DEMOSTRACIÓN Un punto y está en aff {v1,..., Vp} si y solo si existen pesos Cj,..., Cp 


tales que 
yI MA V2 a Vp 
Hd 
Esto ocurre si y solo si Y se encuentra en Gen (Vy, Va,..., Vp). A 
3 1 1 4 
EJEMPLO 4 Seanv¡=| 1 |,v.=| 2 |,v3=| 7 |yp=| 3 |. Utilice el teorema 
1 2 1 0 


4 para escribir p como una combinación afín de v;, va y v3, si es posible. 
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SOLUCIÓN Se reduce por filas la matriz aumentada para la ecuación 
x1V1 + x2V2 + x3V3 =P 
Para simplificar la aritmética, se mueve la cuarta fila de unos hasta arriba (lo que equivale 


a tres intercambios de filas). Después de esto, el número de operaciones aritméticas aquí es 
básicamente el mismo que el número que necesita el método del teorema 1. 


l 1 1 1 l 1 1 1 
i a h plo 3 1 1 4| [o-2-2 1 
LE A 0 1 6 2 
1 2 1 0 0 1 0—1 

1 0 0 15 

0 1 0 -l 

AAA A 5 

0.0.0 0 


De acuerdo con el teorema 4, 1.5 v; — vz + .5v3 = p. Véase la figura 4, que muestra el plano 








que contiene a V1, V2, V3 y p Junto con los puntos sobre los ejes coordenados). E 
% 
3 
1 ta 
y” i 
sL AA SR 
Xi p o 
1 
FIGURA 4 


PROBLEMA DE PRÁCTICA 


Dibuje los puntos vı = [0]... = mE = H yp= lA en un hoja de papel para 


gráficas, y explique por qué p debe ser una combinación afín de v,, v2 y V3. Después, en- 
cuentre la combinación afín para p. [Sugerencia: Pregúntese cuál es la dimensión de 
aff(v1, va, v3)]. 


8.1 EJERCICIOS 


En los ejercicios 1 a 4, escriba y como una combinación afín de los 1 2 4 -3 
otros puntos indicados, si es posible. 4 1=]|2|,v=|-6|,v3=|3]|,y= | 4 
PAPRA] Se 
f 2p 2p 4p TA 3 2 1 2 
En los ejercicios 5 y 6, sean b; = | 1 |, b2 = 0 |, b; = | —5 
1 —1 3 5 1 —2 1 
2 i sa psi] 
y S= (bj, b,, b3). Observe que S es una base ortogonal para [R?. 
33 0 4 17 Escriba cada uno de los puntos dados como una combinación afín 
Rs llm= 4|w=|-2|y= 1 de los puntos del conjunto S, si es posible. [Sugerencia: Para encon- 
2 6 5 trar los pesos, aplique el teorema 5 de la sección 6.2 en vez de la 


reducción por filas]. 


5. 


6. 


10. 


3 6 0 
a p=|8 b p=|-3|c p=|-1 
4 3 —5 
0 1.5 5 
a p=|-19| b. p = | -1.3 c. p = | —4 
=5 =.5 0 
Sean 
1 2 —-1 
_ pom Ed Ma! = 2 
vi; = 31 Y = ol Ya = 1b 
0 4 1 
5 —9 4 
—3 10 2 
P:i T 5 , P2 = 9 , P3 = 8 
3 -13 5 


y S = {v1, V2, V3}. Es posible demostrar que S es linealmente 
independiente. 


a) Está pı en Gen S? ¿Se encuentra pı en aff S? 
b) ¿Se encuentra pz en Gen S? ¿Está p2 en aff S? 


c) ¿Está p3 en Gen S? ¿Se encuentra p3 en aff S? 


Repita el ejercicio 7 considerando 


1 2 3 
0 1 0 

v = 3p Y= 6 | v = 12 | 
—2 —5 —6 


aae a y “i 
| L 6] | -s 


Suponga que las soluciones de una ecuación Ax = b son to- 


das de la forma x = x3u + p, donde u = [yo = E 


Encuentre los puntos vı y v2 tales que el conjunto solución de 
Ax = b sea aff{ v1, v2}. 


Suponga que las soluciones de una ecuación Ax = b son todas 


1 
de la forma x = x3u + p, donde u = llyp=|-3 
-5 4 


Obtenga puntos vı y V2 tales que el conjunto solución de 
Ax = b sea aff{ v1, v2}. 


En los ejercicios 11 y 12, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


11. 


a) El conjunto de todas las combinaciones afines de puntos en 
un conjunto § se denomina envolvente afín de S. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 
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b) Si {b;,..., bz} es un subconjunto linealmente independiente 
de [R” y si p es una combinación lineal de b,,..., bz, entonces 
p es una combinación afín de b,,..., bz. 


c) La envolvente afín de dos puntos distintos se llama recta. 
d) Un plano afín es un subespacio. 


e) El plano en R3 es un hiperplano. 


a) Si S = {x}, entonces aff S es el conjunto vacío. 

b) Un conjunto es afín si y solo si contiene su envolvente afín. 
c) Un plano afín de dimensión 1 se llama recta. 

d) Un plano afín de dimensión 2 se llama hiperplano. 

e) Un plano afín que pasa por el origen es un subespacio. 
Suponga que {v1, V2, V3} es una base para R?. Demuestre que 


Gen {v2 — V1, V3 — Vı} es un plano en R3. [Sugerencia: Piense 
qué se puede decir sobre u y v cuando Gen {u, v} es un plano]. 


Demuestre que si {V1, V2, V3} es una base para R3, entonces 
aff {v1, V2, V3} es el plano a través de v1, V2 y V3. 


Sea A una matriz de m x n y, si b está en R”, demuestre que el 
conjunto S de todas las soluciones de Ax = b es un subconjunto 
afín de R”. 


Considere que v e R” y k e R. Demuestre que S = {x e R”: 
x-v = k) es un subconjunto afín de R”. 


Seleccione un conjunto S de tres puntos tales que aff S sea el 
plano en R3 cuya ecuación es x3 = 5. Justifique su trabajo. 


Seleccione un conjunto S de cuatro puntos distintos en R3 
tal que aff S sea el plano 2x1 + x2 — 3x3 = 12. Justifique su 
trabajo. 





Sea S un subconjunto afín de R”, y suponga que f: R” => R” 
es una transformación lineal, y que f(S) denota el conjunto de 
imágenes (f(x): x e 5). Demuestre que f(S) es un subconjunto 
afín de R”. 


Sean f : R” —> R” una transformación lineal, T un subcon- 
junto afín de R”, y $ = {x e R” : f(x) e T}. Demuestre que S 
es un subconjunto afín de R”. 


En los ejercicios 21 a 26, demuestre el enunciado sobre subconjuntos 
A y B de R”, o dé el ejemplo requerido en R?. Una demostración para 
un ejercicio puede utilizar los resultados obtenidos en los ejercicios 
anteriores (así como los teoremas disponibles en el libro). 


21. 
22. 
23. 


24. 


25. 
26. 


Si A CB y B es afín, entonces aff A C B. 
Si A C B, entonces aff A C aff B. 


[(aff A) U (aff B)] C aff (A U B). [Sugerencia: Para demostrar 
que D U EC F, demuestre que DC Fy ECF]. 


Encuentre un ejemplo en R? para demostrar que la igualdad 
no necesariamente es válida en el enunciado del ejercicio 23. 
[Sugerencia: Considere los conjuntos A y B, cada uno los cuales 
solamente contiene uno o dos puntos]. 


aff (A N B) C (aff A N aff B) 


Encuentre un ejemplo en R? para demostrar que la igualdad no 
necesita ser válida en el enunciado del ejercicio 25. 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Como los puntos v1, V2 y Y3 no son colineales (es decir, no están sobre una recta), aff [v;, 
V2, V3) no puede ser unidimensional. Por lo tanto, aff [v¡, V2, v3} debe ser igual a R?. 
Para encontrar los pesos reales utilizados para expresar p como una combinación afín de 
V1, V2 y V3, primero calcule 


—2 2 3 
v-v =| A n= |7| y pm =|3| 


Para escribir p — v¡ como una combinación lineal de vz — vi y v3 — v,, se reduce por filas 
la matriz que tiene estos puntos como columnas: 


—2 2 3 1 0 
2 1 3 0 1 2 
Así, p — V1 = iv — v1) + 2(v3 — v1), lo que muestra que 


p=(1- 3-2) vw, + įv + 2v3 =-—3v1 + 5v2 +23 


Esto expresa p como una combinación afín de v;, v2 y v3, porque los coeficientes suman 1. 
Alternativamente, utilice el método del ejemplo 3 y reduzca por filas: 


Se e l 1 1 1 1 0 0 $ 
1 2: 3 AP = ~n 1 
k A r 1-1 3 4 a 
2 3 0.0.1 2 


Esto demuestra que p = —3v1 + lv + 2v3. 


8.2 | INDEPENDENCIA AFÍN 


DEFINICIÓN 


En esta sección se continuará explorando la relación entre conceptos lineales y conceptos 
afines. Primero considere un conjunto de tres vectores en R3, por ejemplo, $ = {v1, V2, V3}. 
Si S es linealmente dependiente, entonces uno de los vectores es una combinación lineal de 
los otros dos vectores. ¿Qué ocurre cuando uno de los vectores es una combinación afín 
de los otros? Por ejemplo, suponga que 


v3 = (1 — £)v¡ + tv2, para alguna ten R. 
Entonces, 


(1 —t) vi +1tv2.-v3=0 


Esta es una relación de dependencia lineal ya que no todos los pesos son cero. Pero hay algo 
más que es verdad: los pesos en la relación de dependencia suman cero: 


nas) 0 


Esta es la propiedad adicional necesaria para definir dependencia afín. 


Un conjunto indexado de puntos (v;,..., Vp} en R” es afínmente dependiente si existen 
números reales c;,..., C,, no todos cero, tales que 


CU E VEU (1) 


De lo contrario, será afínmente independiente. 


TEOREMA 5 
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Una combinación afín es un tipo especial de combinación lineal, y la dependencia afín es 
un tipo restringido de dependencia lineal. Por lo tanto, cada conjunto afínmente dependiente 
es, de manera automática, linealmente dependiente. 

Un conjunto (v,) de solo un punto (aun el vector cero) debe ser afínmente independiente 
porque las propiedades requeridas de los coeficientes c; no se pueden satisfacer cuando solo 
existe un coeficiente. Para {v;}, la primera ecuación en (1) es justamente cı = 0, y al menos 
un coeficiente (el único) debe ser distinto de cero. 

En el ejercicio 13 se le pide demostrar que un conjunto indexado {v1, v2} es afínmente 
dependiente si y solo si v; = v2. El siguiente teorema trata el caso general y muestra cómo el 
concepto de dependencia afín es análogo al de dependencia lineal. Los incisos c) y d) brindan 
métodos útiles para determinar si un conjunto es afínmente dependiente. De la sección 8.1, 
recuerde que si v está en RR”, entonces el vector Y en R”*! denota la forma homogénea de v. 


Dado un conjunto indexado S = (v;,..., vp) en [R”, con p = 2, los siguientes enuncia- 
dos son lógicamente equivalentes. Es decir, todos ellos son verdaderos o todos son 
falsos. 


a) Ses afínmente dependiente. 
b) Uno de los puntos en $ es una combinación afín de los demás puntos en S. 
c) El conjunto {v2 — V1,..., Vp — V1} en R” es linealmente dependiente. 


d) El conjunto (V1,..., V») de formas homogéneas en R”+! es linealmente depen- 
diente. 


DEMOSTRACIÓN Suponga que el enunciado a) es verdadero, y sea que c1,..., Cp satisfagan 
(1). Al renombrar los puntos en caso necesario, se puede suponer que cı + O y dividir ambas 
ecuaciones en (1) entre c1, de manera que 1 + (c2/c1) +++- + (cp/c1) =0 y 


vı = (=c2/c1)V2 +-*** + (—cp/c1)Yp (2) 


Observe que los coeficientes en el lado derecho de (2) suman 1. Así, a) implica b). Ahora, 
suponga que b) es verdadero. Al renombrar los puntos en caso necesario, se puede suponer 
que vı = C2V2 + +++ + CpYp, donde c2 + ++: + Cp = 1. Entonces, 


(c2 ++- + Cp)Vi = C202 + ++- + CpYp 6) 


ca[ va — VI) +-"*+cp(vp—v1)=0 (4) 


No todos los coeficientes c>,..., cy pueden ser cero porque suman 1. Así, b) implica c). 

Ahora si c) es verdadero, entonces existen pesos C,..., Cp, no todos cero, tales que la 
ecuación (4) se cumple. Se rescribe (4) como (3) y se establece c, = — (c2 + ++: + cp). Enton- 
ces, C1 + *** + Cp =0. Así, (3) muestra que (1) es verdadera. Por lo que c) implica a), lo que 
prueba que a), b) y c) son lógicamente equivalentes. Por último, d) es equivalente a a) por- 
que las dos ecuaciones en (1) son equivalentes a la siguiente ecuación que implica las formas 
homogéneas de los puntos en S: 


[eef] E i 


En el enunciado c) del teorema 5, vı se podría remplazar por cualquiera de los otros pun- 
tos en la lista v,,..., v,. En la demostración, solo cambiaría la notación. Así, para determinar 
si un conjunto es afínmente dependiente, se resta un punto en el conjunto de los demás pun- 
tos, y se comprueba si el conjunto trasladado de p — 1 puntos es linealmente dependiente. 
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EJEMPLO 1 La envolvente afín de dos distintos puntos p y q es una recta. Si un tercer 
punto r está sobre la recta, entonces (p, q, r) es un conjunto afínmente dependiente. Si un pun- 
to s no está sobre la recta que pasa por p y q, entonces esos tres puntos no son colineales y 
Tp, q, s) es un conjunto afínmente independiente. Véase la figura 1. E 


aff {p, q} 


P 
T s 


FIGURA 1 {p, q, r} es afínmente dependiente. 


1 2 0 
EJEMPLO 2 Seanv, =|3 |, v2»=]| 7 |, v3=| 4 |yS= ([v,, va, v3). Determine 
7 6.5 7 
si S es afínmente independiente. 
1 —1 
SOLUCIÓN Se calcula vz — vı = 4 y V3=v1= 1 |. Esos dos puntos no son 
—.5 0 


múltiplos, así que forman un conjunto linealmente independiente, S’. De manera que son 
falsos todos los enunciados del teorema 5, y S es afínmente independiente. La figura 2 
muestra a S y al conjunto trasladado S’. Observe que Gen S’ es un plano que pasa por el ori- 
gen y aff S es un plano paralelo que pasa por v1, v2 y v3. (Desde luego, aquí solo se muestra 
una parte de cada plano). E 


X3 


aff {v1 , V2, V3} 


V3=V1 





*2 
v)- Y 
al Gen {v3 — V1, Y3 — V1} 
xi 


FIGURA 2 Un conjunto {v1, V2, V3} afínmente 


independiente. 
1 2 0 0 
EJEMPLO 3 Seanvi=| 3 |, v=] 7 |, vw=]|4]| y vi=]| 14 | y 
7 6.5 7 6 
S = [vi,..., Va). ¿S es afínmente dependiente? 
1 —1 —1 
SOLUCIÓN Se calcula v, — vı = 4 |, v3 =v = l|y viv =| 11 | y se 
—.5 0 —1 


reduce por filas la matriz: 


1 —1 -1 1 =I- 231 1 —1 -1 
4 1 l¡-=]|0 5 I5|=|0 5 15 
=5 0 —1 0 —5 —1.5 0 0 0 


Recuerde, de la sección 4.6 (o de la sección 2.8) que las columnas son linealmente depen- 
dientes porque no toda columna es una columna pivote; así que v2 — V1, V3 — Vı Y V4 — V1 


TEOREMA 6 


DEFINICIÓN 
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son linealmente dependientes. De acuerdo con el enunciado c) del teorema 5, {V1, V2, V3, V4} 
es afínmente dependiente. Esta dependencia también se puede establecer empleando el inciso 
d) del teorema 5 en vez del c). a 


Los cálculos del ejemplo 3 muestran que v4 — Vı es una combinación lineal de v — vı 
y V3 — V1, lo que significa que v4 — vV; está en Gen {v2 — V1, V3 — Vı}. De acuerdo con el 
teorema 1 de la sección 8.1, v4 se encuentra en aff {v1, V2, v3}. De hecho, si en el ejemplo 3 
se completara la reducción por filas de la matriz se mostraría que 


Va — vi = 2(v2— vi) + 3(v3— V1) (5) 
v4 = —4v; + 2v2 + 3v3 (6) 


Véase la figura 3. 





FIGURA 3 v; está en el plano aff {v1, v2, V3}. 


La figura 3 muestra rejillas sobre Gen{v2 — v1, V3 — vı} y aff{vı, V2, V3}. La rejilla 
sobre aff {v1, V2, V3} se basa en la ecuación (5). Otro “sistema de coordenadas” se puede 
basar en la ecuación (6), en la cual los coeficientes —4, 2 y 3 son las coordenadas afines 
o baricéntricas de v4. 


Coordenadas baricéntricas 


La definición de coordenadas baricéntricas depende de la siguiente versión afín del teorema 
de representación única de la sección 4.4. Para la demostración, véase el ejercicio 17 de esta 
sección. 


Sea S = {v1,..., Vg} un conjunto afínmente independiente en R”. Entonces, cada p en 
aff S tiene una única representación como una combinación afín de v;,..., Vg. Es decir, 
para cada p existe un único conjunto de escalares c,..., cx tales que 


PRICE y crec => 1 (7) 


Sea S = {v1,..., Vx) un conjunto afínmente independiente. Así, para cada punto p en 
aff S, los coeficientes c;,..., cy en la representación única (7) de p son las coordena- 
das baricéntricas (que, en ocasiones, también se conocen como coordenadas afines) 
de p. 


Observe que (7) es equivalente a la ecuación 


[p]=0[1]++0[%] 6) 


que implica las formas homogéneas de los puntos. La reducción por filas de la matriz aumen- 
tada [v + Ve p] para (8) produce las coordenadas baricéntricas de p. 


448 CAPÍTULO 8 Geometría de espacios vectoriales 


EJEMPLO 4 Sean a= |; >= HS ll y p= E Encuentre las coorde- 


nadas baricéntricas de p determinadas por el conjunto afínmente independiente {a, b, c}. 


SOLUCIÓN Reduzca por filas la matriz aumentada de puntos en forma homogénea, movien- 
do la última fila de unos hacia la parte superior para así simplificar la aritmética: 


- I: -3 9 S ICAA A 
[à b ES OA E AS E 3 9 5 
1 1 1 1I 7 0 3 3 
0 0 i 
=|0 1 0 3 
0 0 1 ¿4 
Las coordenadas son 4, 3 y $ de manera que p = la + ib + $e. ho 


Las coordenadas baricéntricas tienen interpretaciones físicas y geométricas. Original- 
mente, A. F. Moebius las definió en 1827 para un punto p dentro de una región triangular con 
vértices a, b y c. Moebius escribió que las coordenadas baricéntricas de p son tres números 
no negativos Ma, My y Me tales que p es el centro de masa de un sistema que consiste en el 
triángulo (sin masa) y las masas ma, my y Me en los vértices correspondientes. Las masas están 
unívocamente determinadas al requerir que su suma sea 1. Este punto de vista es útil en la 
física actual. ! 

La figura 4 da una interpretación geométrica a las coordenadas baricéntricas del 
ejemplo 4, al mostrar el triángulo Aabe y tres pequeños triángulos Apbe, Aapc y Aabp. 
Las áreas de los pequeños triángulos son proporcionales a las coordenadas baricéntricas 
de p. En efecto, 


área(Apbce) = — : área(Aabc) 


Ul= pro 


área(Aapc) = 7 : área(Aabc) (9) 


5 
área(Aabp) = P área(Aabc) 


a 






área = s - área(Aabc) 


área = 1 - área(Aabc) 


b área = r - área(Aabc) 


FIGURA 4 p = ra + sb + tc. Aquí, r = 4, 


E 
s=3t5 p. 


En los ejercicios 21 a 23 se comprueban las fórmulas de la figura 4. Las igualdades 


análogas para volúmenes de tetraedros son válidas para el caso en que p es un punto dentro 
de un tetraedro en R3, con vértices en a, b, e yd. 


1 Véase el ejercicio 29 de la sección 1.3. En astronomía, sin embargo, el término “coordenadas baricéntricas” por lo 
general se refiere a las coordenadas ordinarias de puntos en R3 y que ahora se conoce como Sistema de referencia 
celeste internacional, un sistema de coordenadas cartesianas para el espacio exterior, con el origen en el centro de 
masa (el baricentro) del Sistema Solar. 
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Cuando un punto no está dentro del triángulo (o del tetraedro), algunas o todas las coor- 
denadas baricéntricas serán negativas. En la figura 5 se ilustra el caso de un triángulo, para 
los vértices a, b, c, y los valores coordenados anteriores r, s, t. Por ejemplo, los puntos so- 
bre la recta que pasa por b y e tienen r = O porque son combinaciones afines solamente de b 
y c. La recta paralela que pasa por a identifica los puntos con r = 1. 


FIGURA 5 Coordenadas baricéntricas 
para puntos en aff (a, b, e). 


Coordenadas baricéntricas en gráficos generados 
por computadora 


Cuando un diseñador trabaja con objetos geométricos en un programa de generación de gráfi- 
cos, puede utilizar una aproximación de “malla de alambre” para un objeto en ciertos puntos 
clave durante el proceso con la finalidad de crear una imagen final realista.? Por ejemplo, si la 
superficie de una parte del objeto consiste en pequeñas superficies triangulares planas, enton- 
ces el programa de gráficos fácilmente puede agregar color, iluminación y sombreado a cada 
pequeña superficie cuando solo se conoce esa información en los vértices. Las coordenadas 
baricéntricas ofrecen la herramienta para interpolar suavemente la información de los vértices 
hacia el interior de un triángulo. La interpolación en un punto es simplemente la combinación 
lineal de los valores en los vértices utilizando como pesos las coordenadas baricéntricas. 

Con frecuencia, los colores en un monitor de computadora se describen mediante las 
coordenadas RGB. Una terna (r, g, b) indica la cantidad de cada color (rojo, verde y azul) 
con parámetros que varían de O a 1. Por ejemplo, rojo puro es (1, 0, 0), blanco es (1, 1, 1) y 
negro es (0, 0, 0). 


3 4 1 3 
EJEMPLO 5 Sean v;=| 1 |,v.=|3 |,vwi=|5|yp=| 3 |]. Los colores en 
5 4 1 3.5 


los vértices v1, v2 y V3 de un triángulo son magenta (1, O, 1), magenta claro (1, .4, 1) y púrpura 
(6, O, 1), respectivamente. Encuentre el color interpolado en p. Véase la figura 6. 


M 


va 


FIGURA 6 Colores interpolados. 


2 El ejemplo introductorio del capítulo 2 menciona un modelo de alambre para un avión Boeing 777, empleado para 
visualizar el flujo de aire sobre la superficie de la aeronave. 
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SOLUCIÓN Primero, determine las coordenadas baricéntricas de p. Aquí se presenta el 


cálculo utilizando las formas homogéneas de los puntos; el primer paso consiste en mover 
la fila 4 a la fila 1: 


1 1.1 1 1 0 0 25 
[ñ o w p]- 3 4 1 3 | |0 1 0 .50 
1 3 5 3 0 0 1 .25 
Sl LS 0 0. 0 0 


Así, p = .25v¡ + .Sv2 + .25v3. Utilice las coordenadas baricéntricas de p para hacer una 
combinación lineal de los datos de color. Los valores RGB para p son 


1 1 .6 .9 | rojo 
.25| 0 | +.50| .4 | +.25| 0 | = | .2 | verde E 
1 1 1 1 | azul 


Uno de los últimos pasos en la preparación de la escena gráfica para mostrarla en el mo- 
nitor consiste en eliminar las “superficies ocultas” que no deberían ser visibles en la pantalla. 
Imagine que la pantalla de visualización está formada por un millón de pixeles, y considere 
un rayo o una “línea de visión” desde el ojo del observador hacia un pixel y la colección de 
objetos que forman la escena 3D. El color y el resto de la información que se muestra en el 
pixel sobre el monitor deberían provenir del primer objeto sobre el que incide el rayo. Véase 
la figura 7. Cuando los objetos en la escena gráfica se aproximan por mallas de alambre con 
parches triangulares, el problema de la superficie oculta se puede resolver empleando coor- 
denadas baricéntricas. 





FIGURA 7 Un rayo proveniente del ojo cruza la 
pantalla hacia el objeto más cercano. 


También es posible utilizar matemáticas para encontrar las intersecciones del triángulo 
de rayos para realizar sombreados extremadamente realistas de objetos. Actualmente, este 
método de trazado de rayos es muy lento para trabajos en tiempo real, pero esto podría cam- 
biar en el futuro gracias a recientes avances en implementaciones de hardware.* 


EJEMPLO 6 Sean 


1 8 5 0 1 
v = 1 > V = 1 5 V3 = 11 3 a= 0 , b = 4 y 
—6 —4 22 10 =3 


y x(t) = a + tb para t = 0. Determine el punto donde el rayo x(t) se interseca con el plano que 
contiene el triángulo con vértices v1, V2 y V3. ¿Este punto se encuentra dentro del triángulo? 


3 Véase Joshua Fender y Jonathan Rose, “A High-Speed Ray Tracing Engine Built on a Field-Programmable System”, 
en Proc. Int. Conf. on Field-Programmable Technology, IEEE (2003). (Un solo procesador puede calcular 600 millo- 
nes de intersecciones de triángulos de rayos por segundo). 
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SOLUCIÓN El plano es aff [v;, v2, v3). Un punto típico en este plano se puede escribir como 
(1 — c2 — C3)V1 + C2V2 + C3V3 para algunos c y c3. (En esta combinación los pesos suman 1). 
El rayo x(t) hace intersección con el plano cuando c>, c3 y £ satisfacen 


a =(2- C3)V1 + C2V2 + C3V3 = a + tb 


Reacomode esto como C2(v2 — v1) + c3(v3 — v1) + t(—b) = a — vı. En forma matricial, 


C2 
[vv viv —b]|c3|=a-vw 
t 
Para los puntos específicos dados aquí, 
7 4 -1 
V — V = 0 » V=V¡= 10 |, a— vV = —1 
2 4 16 


La reducción por filas de la matriz aumentada anterior produce 


7 4 -7 —1 1 ; 
0. 10 —4 -—l|=|0 1 0.1 
2 4 3 16 0 0. 1 


Así, c2 = .3, c3 = .1, y £ = 5. Por lo tanto, el punto de intersección es 


0 1 3.5 

x(5) = a + 5b = 0|+5| 4|= 2.0 

10 —3 —5.0 

Además, 
x(5) = (1 — .3 — .1)vı + .3v2 + -1v3 

1 8 5 3.5 
=.6 11+.3 11+.1/ 11 | = 2.0 
—6 —4 —2 =5.0 


El punto de intersección está dentro del triángulo porque todos los pesos baricéntricos para 
x(5) son positivos. E 


PROBLEMAS DE PRÁCTICA 


1. Describa un método rápido para determinar cuándo tres puntos son colineales. 


4 1 5 1 . j 
2. Los puntos vı = Lb Yo = ob v3 = 4 y v4 = 2 forman un conjunto afín- 


mente dependiente. Encuentre los pesos c1,..., c4 que produzcan una relación de depen- 
dencia afín cıvı + +- + c4V4 = 0, donde cı + +++ + c4 = 0, pero no todas las c; son ceros. 
[Sugerencia: Véase el final de la demostración del teorema 5]. 
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8.2 EJERCICIOS 


En los ejercicios 1 a 6, determine si el conjunto de puntos es afínmen- 
te dependiente. (Véase el problema de práctica 2). Si es así, entonces 
construya una relación de dependencia afín para los puntos. 


clobleplo] + [pS] 





1 = 2 0 
3. 2, |-4 | |-11|,| 15 
| -1 8 11 —9 
[= 0 1 = 
4. S3 h = k 7 
| 3 7 6 3 
i 0 —1 0 
5. A O O O O 5 
| -2 1 1 -3 
Pi 0 2 3 
6 13 | |-11]5]|,|5 
[1 -2 2 0 


En los ejercicios 7 y 8, encuentre las coordenadas baricéntricas de 
p con respecto al conjunto de puntos afínmente independiente que 


lo precede. 
1 2 3 i 
—1 1 2 4 
i 2 Plop -2 pP3|-— 
1j L1 o] 2 | 
0 1 1 —1 
1 1 1 
8. la plo b| -6 PPE] -4 
1 2 5 0 


En los ejercicios 9 y 10, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


9. a) Si v;,..., v, están en R” y si el conjunto {V1 — V2, V3 — V2,..., 
Vp — V2} es linealmente dependiente, entonces {V1,..., Vp} es 
afínmente dependiente. (Lea esto con sumo cuidado). 


b) Si vi,..., vp están en [R” y si el conjunto de formas homo- 
géneas [V1,...,V,) en R"+*! es linealmente independiente, 
entonces (v;,..., v,) es afínmente dependiente. 


c) Un conjunto finito de puntos {v1,..., Vg} es afínmente de- 
pendiente si existen números reales c;,..., Cz, NO todos ceros, 
tales que cı + +- + cg = 1 y civi + + cg = O. 


d) Si S = {v1,..., Vp} en R” es afínmente independiente y si p 
en R” tiene una coordenada baricéntrica negativa determi- 
nada por S, entonces p no está en aff S. 


e) Si vı, V2, v3, a y b están en R3 y si un rayo a + tb para t = 0 
se interseca con el triángulo de vértices v1, V2 y V3, entonces 
todas las coordenadas baricéntricas del punto de intersec- 
ción son no negativas. 


10. a) Si {vı,..., Vp} en R” es un conjunto afínmente dependiente, 
entonces el conjunto (V;,...,V,) en R”+! de formas homo- 
géneas puede ser linealmente independiente. 


14. 


15. 


b) Si vi, V2, V3 y v4 están en R? y si el conjunto {v2 — vı, 
v3 — Vi, V4 — Vı} es linealmente independiente, entonces 
{V1i,..., V4} es afínmente independiente. 


c) Dado S$ = {b;,..., b} en R”, cada p en aff S tiene represen- 
tación única como una combinación afín de b,,..., by. 


d) Cuando una información de color se especifica en cada vér- 
tice vı, V2, V3 de un triángulo en R$, entonces el color se 
puede interpolar en un punto p en aff {v1, V2, V3} emplean- 
do las coordenadas baricéntricas de p. 


e) Si T es un triángulo en R? y si un punto p está sobre una 
arista del triángulo, entonces no todas las coordenadas bari- 
céntricas de p (para este triángulo) son positivas. 


Explique por qué cualquier conjunto de cinco o más puntos en 
R? debe tener dependencia afín. 


Demuestre que un conjunto {V1,..., Vp} en R” es afínmente de- 
pendiente cuando p = n + 2. 


Utilice sólo la definición de dependencia afín para demostrar 
que un conjunto indexado {v1, v2} en R” es afínmente depen- 
diente si y solo si vı = v2. 


Las condiciones para dependencia afín son más estrictas que 
para dependencia lineal, así que un conjunto afínmente de- 
pendiente, de manera automática, es linealmente dependien- 
te. Además, un conjunto linealmente independiente no puede 
ser afínmente dependiente y, por lo tanto, debe ser afínmente 
independiente. Construya dos conjuntos indexados linealmen- 
te dependientes Sı y S2 en R? tales que Sı y S2 tengan depen- 
dencia e independencia afines, respectivamente. En cada caso, 
el conjunto deberá contener uno, dos o tres puntos diferentes 
de cero. 


Sean ae aa v=o] y sea S = 


[v1 va, v3). 
a) Demuestre que el conjunto S es afínmente independiente. 


b) Encuentre las coordenadas baricéntricas de p, = Bl 


n- [iJe [i] i] [E 


respecto a S. 


c) Sea T el triángulo con vértices vı, V2 y V3. Cuando se ex- 
tienden los lados de T, las rectas dividen R? en siete re- 
giones. Véase la figura 8. Observe los signos de las coor- 
denadas baricéntricas de los puntos en cada región. Por 
ejemplo, ps está dentro del triángulo T y todas sus coorde- 
nadas baricéntricas son positivas. El punto pı tiene coor- 
denadas (—, +, +). Su tercera coordenada es positiva 
porque p; está sobre el lado v3 de la recta que pasa por vı 
y v2. Su primera coordenada es negativa porque pı es opues- 
to al lado v; de la recta que pasa por v2 y v3. El punto p2 está 
sobre la arista v2v3 de 7. Sus coordenadas son (0, +, +). 
Sin calcular los valores reales, determine los signos de las 
coordenadas baricéntricas de los puntos Pé, P7 y Pg que se 
muestran en la figura 8. 


16. 


17. 


18. 





y 
PAL 
PR Y, 
ale P; 
SR: 
P3 Tp; 
A va x 
CAE P4 
P6 
FIGURA 8 


co) o E 
s[i} wE} [5h ei] 


1 6 
Ps = BE = [$]ys- [v1, Va, va). 


a) Demuestre que el conjunto S es afínmente independiente. 


b) Encuentre las coordenadas baricéntricas de p;, P2 y p3 con 
respecto a S. 


c) En papel milimétrico trace el triángulo T con vértices v1, va 
y v3, extienda los lados como en la figura 5, y trace los pun- 
tos Pa, Ps, Pó y P7. Sin calcular los valores reales, determine 
los signos de las coordenadas baricéntricas de los puntos pa, 


P5, P6 Y P7- 


Demuestre el teorema 6 para un conjunto afínmente indepen- 
diente S = {v1,..., Vg} en R”. [Sugerencia: Un método es imitar 
la demostración del teorema 7 de la sección 4.4]. 


Sea T un tetraedro en posición “estándar”, con tres aristas a lo 
largo de los tres ejes coordenados positivos en R?, y suponga 
que los vértices son ae;, be,, cez y 0, donde [e, e, ez] = £. 
Obtenga las fórmulas para las coordenadas baricéntricas de un 
punto arbitrario p en R°. 


19. 


20. 
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Sean (pi, P2, p3} un conjunto de puntos en [R” afínmente de- 
pendiente y f : R” —> R” una transformación lineal. Demuestre 
que {f(p1), f(P2), f(p3)} es afínmente dependiente en R”. 


Suponga que {p1, P2, p3} es un conjunto afínmente indepen- 
diente en R” y que q es un punto arbitrario en R”. Demuestre 
que el conjunto trasladado {p1 + q, p2 + q, p3 + q} también es 
afínmente independiente. 


En los ejercicios 21 a 24, a, b y e son puntos no colineales en [R? 
y p es cualquier otro punto en R?. Sea que Aabe denote la región 
triangular cerrada determinada por a, b y e, y sea Apbe la región de- 
terminada por p, b y c. Por conveniencia, suponga que a, b y e se 
arreglan de tal forma que det[á4 b č] es positivo, donde å, Ð y č 
son las formas homogéneas estándar de los puntos. 


21. 


22. 


23. 


24. 


Demuestre que el área de Aabe es det[ă b č]/2. [Suge- 
rencia: Consulte las secciones 3.2 y 3.3, incluyendo los ejer- 
cicios]. 


Sea p un punto sobre la recta que pasa por a y b. Demuestre que 
det[a b p]=0. 

Sea p cualquier punto interior de Aabe, con coordenadas bari- 
céntricas (r, s, t), de manera que 


Utilice el ejercicio 19 y un hecho relacionado con determinantes 
(capítulo 3) para demostrar que 


r = (área de Apbc)/(área de Aabc) 
s = (área de Aapc)/(área de Aabc) 
t = (área de Aabp)/(área de Aabc) 


Tome a q sobre el segmento de recta de b a e y considere 
la recta que pasa por q y a, que se puede representar como 
p = (1 — x)q + xa para toda x real. Pruebe que, para cada x, 
det[p b ¿]=x-det[a b č]. A partir de esto y de un 
trabajo anterior, concluya que el parámetro x es la primera 
coordenada baricéntrica de p. Sin embargo, por construcción, 
el parámetro x también determina la distancia relativa entre 
p y q sobre el segmento de q a a. (Cuando x = 1, p = a). 
Cuando este resultado se aplica al ejemplo 5, demuestra que 
los colores en el vértice a y el punto q se interpolan suavemente 
conforme p se mueve a lo largo de la recta entre a y q. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Del ejemplo 1, el problema es determinar si los puntos son afínmente dependientes. 
Utilice el método del ejemplo 2 y reste un punto de los otros dos. Si uno de esos dos nue- 
vos puntos es múltiplo del otro, entonces los tres puntos originales se encuentran sobre 


una recta. 
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2. En esencia, la demostración del teorema 5 señala que una relación de dependencia afín 
entre puntos corresponde a una relación de dependencia lineal entre las formas homo- 
géneas de los puntos, utilizando los mismos pesos. Así, por reducción de filas: 


4 1 5 1 1 1 
[Y Y Vi va =|1 0 4 2|=]4 
1 1 1 1 1 4 2 
1 0 0 —1 
=|0 1 0 125 

0 0. 1 15 
Vea esta matriz como la matriz de coeficientes de Ax = 0 con cuatro variables. Enton- 
ces x4 es libre, x1 = x4, x2 = —1.25x4, y x3 = —.75x4. Una solución es xı = x4 = 4, 
x2 = —5 y x3 = —3. Una dependencia lineal entre las formas homogéneas es 


4v1 — 5V2 — 3v3 + 474 = 0. De esta forma, 4v1 — 5v2 — 3v3 + 4v4 = Q. 

Otro método de solución es trasladar el problema al origen restando v¡ de los otros 
puntos, encontrar una relación de dependencia lineal entre los puntos trasladados, y 
después reacomodar los términos. La cantidad de aritmética implicada es casi la misma 
que en el enfoque que se acaba de mostrar. 


8.3 | COMBINACIONES CONVEXAS 


La sección 8.1 consideró combinaciones lineales especiales de la forma 
C1V1 + C2V2 ++" +CkVxX donde ci+c2++*"+Cci=1 


Esta sección, además, impone la restricción de que los pesos sean no negativos. 


DEFINICION Una combinación convexa de puntos v;, v>,..., V¿ en R” es una combinación lineal de 
la forma 


CIVIC NT 


tal que cı + c2 + =: + ck = 1 y c; = 0 para toda i. El conjunto de todas las combi- 
naciones convexas de puntos en un conjunto S es la envolvente convexa de S, y se 
denota como conv S. 


La envolvente convexa de un solo punto v;, es justamente el conjunto (v¡), igual que 
la envolvente afín. En otros casos, la envolvente convexa está adecuadamente contenida en la 
envolvente afín. Recuerde que la envolvente afín de puntos distintos vı y v2 es la recta 

y = (1 — vı + tv, conten R 
Como los pesos en una combinación convexa son no negativos, los puntos en conv {v1, V2} 
se pueden escribir en la forma 
y=(l1-— t)i +tv, con0szżs1 
que es el segmento de recta entre vı y v2, y de aquí en adelante se denotará como V1V2. 
Si un conjunto S es afínmente independiente y si p e aff S, entonces p e conv $ si y solo 


si las coordenadas baricéntricas de p son no negativas. El ejemplo 1 muestra una situación 
especial en la cual S es mucho más que solo afínmente independiente. 


EJEMPLO 1 Sean 


3 —6 3 0 —10 
0 3 6 3 5 

v= 6 | v = 3 A Pı = 3 |> P2 1P 
—3 0 3 0 —4 


DEFINICIÓN 


TEOREMA 7 
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y S = {v1, V2, V3}. Observe que S es un conjunto ortogonal. Determine si pı está en Gen S, aff 
S y conv S. Y después haga lo mismo para p2. 


SOLUCIÓN Si pı, es al menos, una combinación lineal de los puntos en S, entonces es fácil 
calcular los pesos porque S es un conjunto ortogonal. Sea W el subespacio generado por S. 
Un cálculo como en la sección 6.3 indica que la proyección ortogonal de pı sobre W es el 
mismo pı: 


pı’ yı PY P1’ Y3 
proyw = vı + vV + 
vi.Vi V2°V2 V3. V3 











V3 


18 18,18 
AA E 


3 
1| o0 E 
6 = p; 


DODw 
| 
O wWwWO 


3 


Esto muestra que p, está en Gen S. Además, puesto que los coeficientes suman 1, p, está 
en aff S. De hecho, p¡ está en conv S porque los coeficientes también son no negativos. 

Para p2, un cálculo similar indica que proyy p2 + p». Como proyy pa es el punto en 
Gen S más cercano a p>, entonces el punto p, no está en Gen S. En particular, pz no puede 
estar en aff S o conv S. E 


Recuerde que un conjunto S es afín si contiene todas las rectas determinadas por pares 
de puntos en S. Cuando la atención se restringe a combinaciones convexas, la condición ade- 
cuada implica segmentos de recta en vez de rectas. 


Un conjunto $ es convexo si para cada p, q e S, el segmento de recta pq está con- 
tenido en S. 


Intuitivamente, un conjunto S es convexo si todo par de puntos en el conjunto se puede 
“ver” entre sí sin que la línea de visión salga del conjunto. La figura 1 ilustra esta idea. 


SO a 


Convexo Convexo No convexo 


FIGURA 1 


El siguiente resultado es análogo al teorema 2 para conjuntos afines. 


Un conjunto $ es convexo si y solo si cada combinación convexa de puntos de S se 
encuentra en S. Es decir, S es convexo si y solo si S = conv S. 


DEMOSTRACIÓN El argumento es similar al utilizado en la demostración del teorema 2. 
La única diferencia está en el paso de inducción. Al tomar una combinación convexa de 
k + 1 puntos, considere y = C1V¡ +-** +CrVx + Ck+1Vk+1, donde cy + ° + Ck =S ly 
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TEOREMA 8 


TEOREMA 9 


0 S c; S 1 para toda i. Si ck+1 = 1, entonces y = V¿+1, que pertenece a S, y no hay más 
que probar. Si ck+1 < 1, sea t = cı + ++ + cp. Entonces, t = 1 — ck+1 > Qy 


C1 Ck 
y=(l- cn a Svi) + Ck+1Vk+1 O) 


Según la hipótesis de inducción, el punto z = (c¡/t)v1 +--- + (cx /t)vx está en S porque 
los coeficientes no negativos suman 1. Así, la ecuación (1) presenta a y como una combina- 
ción convexa de dos puntos en S. De acuerdo con el principio de inducción, cada combinación 
convexa de tales puntos se encuentra en S. E 


El teorema 9 que se expone a continuación ofrece una caracterización más geométrica 
de la envolvente convexa de un conjunto. Se requiere un resultado preliminar de intersec- 
ciones de conjuntos. Recuerde de la sección 4.1 (ejercicio 32) que la intersección de dos 
subespacios es, en sí misma, un subespacio. De hecho, la intersección de cualquier colección 
de subespacios es, en sí misma, un subespacio. Un resultado similar es válido para conjuntos 
afines y conjuntos convexos. 


Sea {Sa : 4 e A) cualquier colección de conjuntos convexos. Entonces, Nae4Sa es 
convexo. Si (Tg : 6 e B) es cualquier colección de conjuntos afines, entonces NgegTg 
es afín. 


DEMOSTRACIÓN Si p y q están en NS, entonces p y q están en cada S.,. Como cada Sa 
es convexo, el segmento de recta entre p y q está en Są para toda «æ y, por lo tanto, ese seg- 
mento está contenido en N Sa. La demostración para el caso afín es similar. E 


Para cualquier conjunto S, la envolvente convexa de S es la intersección de todos los 
conjuntos convexos que contienen a S. 


DEMOSTRACIÓN Sea T la intersección de todos los conjuntos convexos que contienen a S. 
Como conv $ es un conjunto convexo que contiene a $, se deduce que T C conv S. Por otro 
lado, sea C cualquier conjunto convexo que contiene a S. Entonces, C contiene a toda com- 
binación convexa de puntos de C (teorema 7) y, por consiguiente, también contiene a toda 
combinación convexa de puntos del subconjunto S. Es decir, conv S C C. Puesto que esto es 
verdad para todo conjunto convexo C que contiene a S, esto también es válido para la inter- 
sección de todos ellos. Es decir, conv S$ C T. E 


El teorema 9 señala que conv S es, en un sentido natural, el “menor” conjunto convexo 
que contiene a S. Por ejemplo, considere un conjunto S que está dentro de algún gran rec- 
tángulo en R?, e imagine estirar una banda de hule alrededor del exterior de S. Cuando la 
banda se contrae alrededor de S, indica la frontera de la envolvente convexa de S. O bien, 
para usar otra analogía, la envolvente convexa de S llena todos los huecos en el interior de S 
y rellena todas las abolladuras en la frontera de S. 


EJEMPLO 2 


a) A continuación se muestran las envolventes convexas de los conjuntos S y T en R?, 














E 








S conv $ T conv T 





FIGURA 2 
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TEOREMA 10 


8.3 Combinaciones convexas 457 


b) Sea S el conjunto que consta de la base estándar para R3, S = {e1, e2, e3}. Entonces, 
conv S es una superficie triangular en R°, con vértices e1, e2 y e3. Véase la figura 2. W 


EJEMPLO 3 Sea S= [z] ix>0yy= al Demuestre que la envolvente convexa 
de S es la unión del origen y | | A | ix>0yy> «el Véase la figura 3. 


SOLUCIÓN Cada punto en conv S debe estar en un segmento de recta que conecte dos 
puntos de S. La línea discontinua de la figura 3 indica que, excepto por el origen, el eje y 
positivo no está en conv S, porque el origen es el único punto de S sobre el eje y. Parece- 
ría razonable que la figura 3 muestre conv S, pero, ¿cómo se podría estar seguro de que el 
punto (1072, 10%), por ejemplo, está sobre un segmento de recta del origen a un punto sobre 
la curva en S? 

Considere cualquier punto p en la región sombreada de la figura 3, por ejemplo, 


p= el cona>0yb=a? 


La recta que pasa por 0 y p tiene la ecuación y = (b/a)t para t real. Esta recta se interseca 
con S donde * satisface (b/a)t = 1?, es decir, cuando t = b/a. Así, p está sobre el segmento 


de recta de 0 a | Pa | lo que indica que la figura 3 es correcta. E 


El siguiente teorema es básico en el estudio de conjuntos convexos. Constantin 
Caratheodory fue el primero en probarlo en 1907. Si p está en la envolvente convexa de 
S, entonces, por definición, p debe ser una combinación convexa de puntos de S. Pero la 
definición no establece cuántos puntos de § se requieren para construir la combinación. 
El notable teorema de Caratheodory dice que en un espacio n-dimensional, el número de 
puntos de S en la combinación convexa nunca es mayor que n + 1. 


(Caratheodory) Si S es un subconjunto no vacío de R”, entonces cada punto en conv S 
se puede expresar como una combinación convexa de n + 1 o menos puntos de S. 


DEMOSTRACIÓN Dado p en conv S, se puede escribir p = c¡v¡ + *** + CgVx, donde 
vie S, c + + c= 1 yc; = 0, para alguna k e i = 1,..., k. El objetivo es demostrar 
que tal expresión existe para p conk Sn + 1. 

Si k >n + 1, entonces {v1,..., Vg} es afínmente dependiente, de acuerdo con el ejerci- 
cio 12 de la sección 8.2. Así, existen escalares d;,..., d;, no todos cero, tales que 


k k 
ye d; V = 0 y > di =0 
i=l i=l 
Considere las dos ecuaciones 


C1V1 + C2V2 + +e + CkYk = P 


divi + dava ++ divx =0 


Restando un múltiplo adecuado de la segunda ecuación a la primera, se elimina uno de los 
términos v, y se obtiene una combinación convexa de menos que k elementos de S que es 
igual a p. 
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Como no todos los coeficientes d, son cero, podemos suponer (reacomodando subín- 
dices, si es necesario) que d; > 0 y que c;/d; < c;/d; para todas aquellas i para las que 
di> 0. Para i = 1,..., k, sea b; = ci — (ck/dp)di. Entonces, bg = 0 y 


k k E k 
Dar= Y a dí =1-0=1 
k 


i=l i=l i=l 


Además, cada b; = 0. En realidad, si d; S 0, entonces b; = c; = 0. Si d; > 0, entonces 
bi = di(ci/di — ck/dġ) = 0. Por construcción, 


k—1 k k Ch 
X bivi = X biv; = > (a = a) Vi 


i=1 i=1 i=l 


k k k 
= Dm q Dd = X civi =p 


i=1 i=1 i=l 


De esta forma, p ahora es una combinación convexa de k — 1 de los puntos v1,..., Vk. 
Este proceso se puede repetir hasta que p se exprese como una combinación convexa de, 
a lo sumo, n + 1 de los puntos de S. E 


El siguiente ejemplo ilustra los cálculos de la demostración anterior. 


EJEMPLO 4 Sean 


AE A E 


y S = {V1, V2, V3, V4}. Luego, 


nia la 


lv F iv + lv + b4 =p 2) 


Utilice el procedimiento de la demostración del teorema de Caratheodory para expresar p 
como una combinación convexa de tres puntos de S. 


SOLUCIÓN El conjunto S es afínmente dependiente. Utilice las técnicas de la sección 8.2 
para obtener una relación de dependencia afín 


—5v] + 4v2 — 3v3 + 4v4 = 0 (3) 


Después, seleccione los puntos vz y va en (3), cuyos coeficientes sean positivos. Para cada 
punto, calcule la razón de los cocientes en las ecuaciones (2) y (3). La razón para vaz es 
z =4= z y para v4 es 5 =4= 5 La razón para v4 es menor, así que reste 5 multipli- 
cado por la ecuación (3) de la ecuación (2) para eliminar v4: 


Gn aer ed) + (5 n=» 


17 4 27 E, 
3V1 + 3V2 + RY =P E 


Por lo general, este resultado no se puede mejorar al disminuir el número requerido de 
puntos. En realidad, dados cualesquiera tres puntos no colineales en R?, el centroide del trián- 
gulo formado por ellos está en la envolvente convexa de los tres, pero no está en la envolvente 
convexa de dos cualesquiera de ellos. 


PROBLEMAS DE PRÁCTICA 


6 
1. Sean v; = | 2 
2 


nh = 


7 
1 
5 
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—2 1 3 

»1W=| 4| p=|3|yp=|2| y S = (vi, 
—1 1 1 


v2, V3}. Determine si pı y p2 están en conv S. 


2. Sea S el conjunto de puntos sobre la curva y = 1/x para x > 0. Explique geométricamente 
por qué conv S consiste en todos los puntos sobre la curva S y por arriba de ella. 


8.3 EJERCICIOS 


. En R, sea s=([7]:0<><Jul[5] Describa 


(o bosqueje) la envolvente convexa de S. 
. Describa la envolvente convexa del conjunto S de puntos | | 


en R? que satisfacen las condiciones indicadas. Justifique sus 
respuestas. (Demuestre que un punto arbitrario p en S pertenece 
a conv S). 


a) y=1/xyx=1/2 
b) y =senx 
c)y=x1Myx=0 


. Considere los puntos del ejercicio 5 de la sección 8.1. ¿Cuáles 
de pı, P» y p3 están en conv $? 


. Considere los puntos del ejercicio 6 de la sección 8.1. ¿Cuáles 
de Pi, P» y p3 están en conv S? 





Sean 
-1 0 1 1 
vi = 3 HV = 3 s, V3 = 1 Va 1 . 
4 1 4 —2 
0 
P: = a > P2 = —2 y 
2 
y sea S = (vi, V2, V3, V4}. Determine si pı y p2 están en 
conv S. 
2 0 E) -1 
0 —2 1 2 
a A a E a A =3 | 
2 1 2 5 | 
2 
1 
-1 6 >j 
p. 1 |> P3 ¡[Y P=| ofp Y S el conjunto 


W EL 


ortogonal {v1, V2, V3}. Determine si cada p; está en Gen S, aff S 
o conv S. 


a) Pp: D) p2 C) P3 d) p4 


Los ejercicios 7 a 10 utilizan la terminología de la sección 8.2. 


7. 


10. 


osar- [PEJ] 
n- Ehe- [i] eih- L] 


Encuentre las coordenadas baricéntricas de p1, P2, P3 Y Pa 
con respecto a T. 


b) Utilice sus respuestas del inciso a) para determinar si cada 
uno de pi,..., pa en el inciso a) está dentro, fuera o en la 
arista de conv T, una región triangular. 


cocer (LE 


[3] 9-[1)0-[;Jo-[3 


Sea S = (vi, va, v3, v4) un conjunto afínmente independiente. 
Considere los puntos pi,..., ps, cuyas coordenadas baricéntri- 
cas con respecto a S están dadas por (2, 0, 0, —1), (0, $, 1, 1) 
(3,0, 3, -1), (4, 1, A 2) y (3,0, 2,0), respectivamente. Deter- 
mine si cada uno de p;,.... ps está dentro, fuera o sobre la super- 
ficie de conv S, un tetraedro. ¿Algunos de esos puntos están en 
la arista de conv $? 


Repita el ejercicio 9 para los puntos q1,..., q5 cuyas coordenadas 

baricéntricas con respecto a § están dadas por (4, E, i, 1), 
3_1pg1 3 1 1.11 

(3 =3+0; 3), (0, 7 3,0), (0, —2,0,3) y (3 3> 30), respec- 

tivamente. 


En los ejercicios 11 y 12, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


11. 


12. 


a) Si y = Civ1 + C2V2 + c3V3 Yy C1 + c2 + c3 = 1, entonces y 
es una combinación convexa de v1, V2 y V3. 

b) Si S es un conjunto no vacío, entonces conv $ contiene al- 
gunos puntos que no están en S. 


c) Si Sy T son conjuntos convexos, entonces S U T también es 
convexo. 


a) Un conjunto es convexo si x, y € S implica que el segmen- 
to de recta entre x y y está contenido en S. 


b) Si S y T son conjuntos convexos, entonces $ N T también 
es convexo. 
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13. 


14. 


15. 


16. 


c) Si S es un subconjunto no vacío de R y y e conv S, en- 
tonces existen distintos puntos V1,..., Ve en S tales que y 
es una combinación convexa de v1,..., Ve. 


Sea S un subconjunto convexo de R” y suponga que f: R” => R” 
es una transformación lineal. Demuestre que el conjunto f(S) = 
(fG6): x e S] es un subconjunto convexo de R”. 


21. 


Sean f: R” — R” una transformación lineal y T un subcon- 
junto convexo de R”. Demuestre que el conjunto S = {x e R” : 
f(x) € T} es un subconjunto convexo de R”. 


1 1 4 4 
sane [i e-i} =E} e- [ih 


p= | : | Confirme que 


1 1 1 1 
P=3V1+3V2+ ¿Va + ¿Va Y Vi Va + v3 va =00 


Utilice el procedimiento de la demostración del teorema de Ca- 
ratheodory para expresar p como una combinación convexa de 
tres de las v;. Haga esto de dos formas. 
—1 [po 
ol =f] 


3 1 1 ; 
v = 1 > Ya = _1 yp= 2 , considerando que 


p= aY t An + Ava + va 
Y 
10v; — 6v2 + 7v3 — llva =0 


Repita el ejercicio 9 para los puntos vı = | 


24. 


En los ejercicios 17 a 20, demuestre el enunciado en cuestión res- 
pecto de los subconjuntos A y B de R”. Una demostración para un 
ejercicio puede emplear resultados de ejercicios anteriores. 


17. 
18. 
19. 


Si A C B y B es convexo, entonces conv A C B. 
Si A C B, entonces conv A C conv B. 


a) [(conv A) U (conv B)] C conv (A U B) 


20. 


22. 
23. 


b) Encuentre un ejemplo en R? para demostrar que la igualdad 
no necesariamente es válida en el inciso a). 


a) conv (A N B)C [(conv A) N (conv B)] 


b) Encuentre un ejemplo en R? para probar que la igualdad no 
necesita ser válida en el inciso a). 


Considere que Po, pı y pz son puntos en R”, y de- 
fina fo(t) =(1—f)p +1p, fi(()=(—1f)p +1fp y 
g) = (1 — t)fo(t) + tfi (t) para O S £ < 1. Para los pun- 
tos que se muestran en la siguiente figura, realice un esquema 
que muestre fo (4), fı (4) y g (4). 


P; P2 


Po 


Repita el ejercicio 21 para fo G) fı (3) yg (3). 


Sea g(t) como se define en el ejercicio 21. Su gráfica se llama 
curva cuadrática de Bézier, y se utiliza en algunos diseños de 
gráficos computacionales. Los puntos po, pı y p2 se llaman pun- 
tos de control de la curva. Calcule una fórmula para g(t) que 
implique solamente a po, pı y p2. Después, demuestre que g(t) 
está en conv {po, Pı, p2} para0 S451. 


Dados los puntos de control po, p1, p2 y p3 en R”, sea g;(f) para 
0 =1< l la curva cuadrática de Bézier del ejercicio 23 determi- 
nada por Po, P1 y Pp», y sea ga(1) definida de manera similar para 
P1, P2 y p3. Para O = 1 <= 1, defina h(+) = (1 — gi(0) + tga(0). 
Demuestre que la gráfica de h(t) está en la envolvente convexa 
de los cuatro puntos de control. A esta curva se le llama curva 
cúbica de Bézier, y su definición aquí es un paso en un algo- 
ritmo para construir curvas de Bézier (analizadas en la sección 
8.6). Una curva de Bézier de grado k se determina por k + 1 
puntos de control, y su gráfica está en la envolvente convexa de 
esos puntos de control. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Los puntos vi, V2 y v3 no son ortogonales, así que se calcula 


1 —8 —5 —3 
v-v = | -l |, v3 -v = 2 |, p-y = 1 |y p- y = 0 
—3 —1 —1 


Aumente la matriz [vz — v; 


1 —=8 
=1. 32 
3 -3 


v3 — Vı] con p¡ — V1 y P2 — Vi y reduzca por filas: 


Z E3 1 0 4 1 

2 1 
1 Oj~j0 1 3 3 
me a o 0. 0-5 


La tercera columna indica que p, — Yi = 1v —= Vv1) + (v3 — v1), lo que conduce a 


pı = 0vı + ly, + fv. Así, pı está en conv S. De hecho, p; está en conv {v2, v3}. 


8.4 | HIPERPLANOS 


DEFINICIÓN 
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La última columna de la matriz indica que p2 — v¡ no es una combinación lineal 
de v2 — Vı y V3 — Vı. Así, p2 no es una combinación afín de vı, V2 y V3, por lo que p2 
quizá no esté en conv $. 

Un método de solución alternativo consiste en reducir por filas la matriz aumentada 
de las formas homogéneas: 


0 
o aa 0 
[Yi va va Pp, p,]- i 
0 


O O O =. 
O O m. Ọ 
O Linun O 
= Oo o 


2. Si p es un punto arriba de S, entonces la recta que pasa por p con pendiente —1 se inter- 
secará con S en dos puntos antes de llegar a los ejes x y y positivos. 


Los hiperplanos desempeñan un papel especial en la geometría de R” porque dividen el es- 
pacio en dos porciones, justo como un plano separa a [R3 en dos partes y una recta corta a R?. 
La clave al trabajar con hiperplanos es utilizar simples descripciones implícitas, en vez de las 
representaciones explícitas o paramétricas de rectas y planos empleadas en el estudio anterior 
de conjuntos afines.' 

Una ecuación implícita de una recta en R? tiene la forma ax + by = d. Una ecuación 
implícita de un plano en R? tiene la forma ax + by + cz = d. Ambas ecuaciones describen 
la recta o el plano como el conjunto de todos los puntos en los cuales una expresión lineal 
(también llamada funcional lineal) tiene un valor fijo, d. 


Una funcional lineal en R” es una transformación lineal f de R” en R. Para todo es- 
calar d en R, el símbolo [f : d] denota el conjunto de todas las x en R” para las cuales 
el valor de f es d. Es decir, 


[f: d] es el conjunto {x e R” : f(x) = d} 


La funcional cero es la transformación tal que f(x) = 0 para toda x en R”. Todas las 
demás funcionales lineales en R” son diferentes de cero. 


EJEMPLO 1 En R?, la recta x — 4y = 13 es un hiperplano en R?, y es el conjunto de 
puntos en los que la funcional lineal f(x, y) = x — 4y tiene valor 13. Es decir, la recta es el 
conjunto [f': 13]. E 


EJEMPLO 2 En R$, el plano 5x — 2y + 3z = 21 es un hiperplano, el conjunto de puntos 
en los que la funcional lineal g(x, y, z) = 5x — 2y + 3z tiene valor 21. Este hiperplano es el 
conjunto [g : 21]. E 


Si f es una funcional lineal en R”, entonces la matriz estándar de esta transformación 
lineal f es una matriz A de 1 x n, por ejemplo, A = [a] a? * an]. De manera que 


[f:0] esigualque {x e R” :Ax = 0} = Nul 4 (1) 


1 Las representaciones paramétricas se estudiaron en la sección 1.5. 
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Si f es una funcional distinta de cero, entonces rango de A = 1, y dim Nul A = n — 1, de 
acuerdo con el teorema del rango.? Así, el subespacio [f : 0] tiene dimensión n — 1 y, por 
lo tanto, es un hiperplano. Además, si d es cualquier número en R, entonces 


[f:d] esigualque {x e R”: Ax = d} (2) 


Recuerde del teorema 6 de la sección 1.5 que el conjunto de soluciones de Ax = b se 
obtiene al trasladar el conjunto solución de Ax = 0, empleando cualquier solución particular 
p de Ax = b. Cuando A es la matriz estándar de la transformación f, este teorema dice que 


[f:d]=[f:0] +p para cualquier p en [f: d] (3) 


Por lo tanto, los conjuntos [f : d] son hiperplanos paralelos a [f: 0]. Véase la figura 1. 





FIGURA 1 Hiperplanos paralelos, 
con f(p) = d. 


Cuando A es una matriz de 1 x n, la ecuación Ax = d se puede escribir con un producto 
interno n-x, empleando n en R” con las mismas entradas que A. Así, a partir de (2), 


[f:d] esigualque (xeR”: nx = d} (4) 


Entonces, [f: 0] = (x e R”: nx = 0), lo que muestra que [f': 0] es el complemento ortogonal 
del subespacio generado por n. En la terminología de cálculo y geometría en R3, n se llama 
un vector normal a [f: 0]. (Un vector “normal” en este sentido no necesita tener longitud 
unitaria). Además, se dice que n es normal a cada hiperplano paralelo [f : d], aunque n-x no 
es cero cuando d + 0. 

Otro nombre para [f : d] es conjunto nivel de f, y n algunas veces se llama gradiente 
de f cuando f(x) = n-x para cada x. 


EJEMPLO 3 Sean n = H y v= [l y sea H = {x : mx = 12}, de manera que 


H = [f: 12], donde f(x, y) = 3x + 4y. Por lo tanto, H es la recta 3x + 4y = 12. Encuentre 
una descripción implícita del hiperplano paralelo (recta) Hı = H + v. 


SOLUCIÓN Primero, encuentre un punto p en HA. Para hacer esto, determine un punto en H 
y súmele v. Por ejemplo, [3| está en H, así que p = [ze] F [3| = i] está en A. 


Ahora, calcule n-p = —9. Esto indica que Hı = [f : —9]. Véase la figura 2, que también 
muestra el subespacio Hp = [x: nx = 0]. E 


Los siguientes tres ejemplos revelan conexiones entre descripciones implícitas y explíci- 
tas de hiperplanos. El ejemplo 4 inicia con una forma implícita. 


2 Véase el teorema 14 de la sección 2.9 o el teorema 14 de la sección 4.6. 
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y 
i 4 + n 
| + 
\ 
Y + 
N + y 
HO O É x 
-4 e UN y 4 
J lv H=1f:12] 
\ 
H | 
al | H =[f:0] 
if H, =[f:-9] 
+ v 
FIGURA 2 


EJEMPLO 4 En R?, dé una descripción explícita de la recta x — 4y = 13 en forma vec- 
torial paramétrica. 


SOLUCIÓN Esto equivale a resolver una ecuación no homogénea Ax = b, donde A = 
[1 —4] y b es el número 13 en R. Escriba x = 13 + 4y, donde y es una variable libre. 
En forma paramétrica, la solución es 


px] _ |13+4y|_ 13 4j 
Aras e 


Es más complicado convertir una descripción explícita de una recta a la forma implícita. 
La idea básica es construir [f: 0] y después encontrar d para [f: d]. 
1 6 
EJEMPLO 5 Sean vı = 2 1YY2=|[ 9 py L; la recta que pasa por vı y v2. Encuentre 
una funcional lineal f y una constante d tales que L; = [f : d]. 


SOLUCIÓN La recta Lı es paralela a la recta trasladada Lọ a través de v2 — vı y el origen. 
La ecuación que define a Lo tiene la forma 


[a p[3|=0 o n:x=0 donde wef] (5) 
y b 
Como n es ortogonal al subespacio Lo, que contiene a v2 — v1, calcule 


pelele 


y resuelva 


Por inspección, una solución es [a b] = [2 5]. Sea f(x, y) = 2x + Sy. A partir de (5), 
Lo = [f: 0], y Lı = [f: d] para alguna d. Como v; está sobre la recta L4, d = f(v¡) = 2(1) + 
5(2) = 12. Así, la ecuación para Lı es 2x + 5y = 12. Como comprobación, observe que 


Fa) = f(6, 0) = 2(6) + 5(0) = 12, de manera que v, también está sobre L4. E 
1 2 3 

EJEMPLO 6 Sean vı = | 1 |, v2 = | —1 | y v3 = | 1 |. Encuentre una descripción 
1 4 2 


implícita [f : d] del plano H; que pasa por v1, V2 y V3. 
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TEOREMA 11 


SOLUCIÓN H; es paralelo a un plano Ho que pasa por el origen y que contiene los puntos 
trasladados 


1 2 
va) — V = —2 y V3=V= (0) 
3 1 
Como esos dos puntos son linealmente independientes, Ho = Gen{v2 — Vi, V3 — vı}. 
a 
Sea n= | b | la normal a Hp. Entonces, v2 — vı y v3 — vı son ortogonales a n. Es decir, 
c 


(vz — vi)n =0 y (v3 — v¡)n = 0. Esas dos ecuaciones forman un sistema cuya matriz 
aumentada se puede reducir por filas: 


Las operaciones de fila dan a = Eje, b= (De, con c libre. Establezca c = 4, por ejemplo. 
-2 
Entonces, n = 5 |y Ho = [f: 0], donde f(x) = —2x1 + 5x2 + 4x3. 
4 


El hiperplano paralelo H; es [f : d]. Para encontrar d, considere el hecho de que v; está 
en H4, y calcule d = f (vı) = f (1,1,1) = —2(1) + 5(1) + 4(1) = 7. Como comprobación, 
calcule f(v2) = f(2,—1,4) = —2(2) + 5—1) + 44) = 16- 9 = 7. E 


El procedimiento del ejemplo 6 se generaliza a mayores dimensiones. Sin embargo, para 
el caso especial de R3, también se puede utilizar la fórmula del producto cruz para deter- 
minar n, aplicando un determinante simbólico como una regla mnemotécnica: 





n = (v2 — V1) X (V3 — V1) 
1 2 i 
==): ip E ES a+) ok 
3 1 k 
—2 
= —2i + 5j + 4k = 5 
4 


Si solo se necesita la fórmula para f, el cálculo del producto cruz se puede escribir como 
un determinante ordinario 











1 2 X1 
2 1 2 
fx, x,x)=|-2 0 x2|= o X= xa + X3 
3 1 3 1 = 0 
3 1 X3 


= —2x1 + 5x2 + 4x3 


Hasta el momento, cada hiperplano examinado se ha descrito como [f: d] para alguna 
funcional lineal f y alguna d en R, o bien, de manera equivalente como {x e R” : nx = d) 
para alguna n en R”. El siguiente teorema indica que todo hiperplano tiene estas descripcio- 
nes equivalentes. 


Un subconjunto H de R” es un hiperplano si y solo si H = [f : d] para alguna funcional 
lineal f diferente de cero y algún escalar d en R. De esta forma, si H es un hiperplano, 
existe un vector n diferente de cero y un número real d tales que H = {x : nx = d}. 




















y 
A 
JS a 
/ JN 
/ E 
/ E 
l 7i N ~L 2 | 
IS + 
¡ [A / 
\ ji /B(0, 3) 
N / 
N / 
‘S / 
sx A A 
FIGURA 3 
El conjunto S es cerrado y 
acotado. 
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DEMOSTRACIÓN Suponga que H es un hiperplano, tome p € H, y sea Ho = H — p. Enton- 
ces, Ho está en un subespacio de dimensión (n — 1). Después, tome cualquier punto y que no 
esté en Ho. De acuerdo con el teorema de descomposición ortogonal de la sección 6.3, 


y=y+n 
donde y; es un vector en Ho y n es ortogonal a todo vector en Hp. La función f definida por 
fœ) =nx paraxe R” 


es una funcional lineal, por las propiedades del producto interno. Ahora, [f : 0] es un hiper- 
plano que contiene a Ho, por construcción de n. Se deduce que 


Ho = [f: 0] 


[Argumento: Ay contiene una base S de n — 1 vectores, y como S está en el subespacio 
(n — 1)-dimensional [ f: 0], entonces S también debe ser una base para [ f: 0], de acuerdo con 
el teorema de la base]. Finalmente, sea d = f(p) = n-p. Por lo tanto, como se muestra en 
la ecuación (3) anterior, 


[f:d]=[f:0)+p=H+p=H 


El enunciado inverso de que [f : d] es un hiperplano se deduce de las ecuaciones (1) y (3) 
anteriores. E 


Muchas importantes aplicaciones de hiperplanos dependen de la posibilidad de “separar” 
dos conjuntos mediante un hiperplano. Intuitivamente, esto significa que uno de los conjuntos 
está sobre un lado del hiperplano, y el otro conjunto está sobre el lado contrario. La termino- 
logía y la notación que se presentan a continuación ayudarán a hacer más precisa esta idea. 


TOPOLOGÍA EN R”: TÉRMINOS Y HECHOS 


Para cualquier punto p en R” y cualquier real ô > 0, la bola abierta B(p, ô) con centro 
en p y radio ô está dada por 


B(p, ô) = {x : |x — pl] < ô} 


Dado un conjunto S en R”, un punto p es un punto interior de S si existe un ô > 0 tal 
que B(p, ô) C S. Si toda bola abierta centrada en p se interseca con $ y con el comple- 
mento de S, entonces p se llama punto frontera de S. Un conjunto es abierto si no 
contiene a ninguno de sus puntos frontera. (Esto es equivalente a decir que todos sus 
puntos son puntos interiores). Un conjunto es cerrado si contiene todos sus puntos 
frontera. (Si $ contiene solamente algunos de sus puntos frontera, entonces § no es 
abierto ni cerrado). Un conjunto S es acotado si existe una ô > O tal que S C B(0, ô). 
Un conjunto en R” es compacto si es cerrado y acotado. 


Teorema: La envolvente convexa de un conjunto abierto es abierta, y la envolvente 
convexa de un conjunto compacto es compacta. (La envolvente convexa de un conjunto 
cerrado no necesita ser cerrada. Véase el ejercicio 27). 


EJEMPLO 7 Sean 


EI. 0 + 


como se muestra en la figura 3. Entonces, p;, es un punto interior porque B(p, 3) CS. 
El punto p» es un punto frontera porque cada bola abierta centrada en p, se interseca con 
S y el complemento de S. El conjunto $ es cerrado porque contiene todos sus puntos frontera. 
El conjunto S es acotado porque S C B(0, 3). Por lo tanto, S también es compacto. E 
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Notación: Si f es una funcional lineal, entonces f(A) S d significa que f(x) S d para cada 
X € A. Las notaciones correspondientes se emplearán cuando las desigualdades estén inver- 
tidas o cuando sean estrictas. 


DEFINICIÓN El hiperplano H = [f: d] separa a dos conjuntos A y B si es válida una de las siguientes 
situaciones: 


i. f(4)=dyf(B)=d, 0 
ii. f(A) = dy f(B) S d. 


Si en las condiciones anteriores todas las desigualdades débiles se remplazan por desi- 
gualdades estrictas, entonces se dice que H separa estrictamente A y B. 


Observe que la separación estricta requiere que los dos conjuntos sean disjuntos, lo que 
no ocurre en la separación simple. Es claro que si dos círculos en el plano son tangentes ex- 
ternamente, entonces su recta tangente común los separa (pero no estrictamente). 

Aunque es necesario que los dos conjuntos sean disjuntos para separarlos estrictamente, 
esta condición no es suficiente, ni siquiera para conjuntos convexos cerrados. Por ejemplo, 


sean 
A eya B=V 7 l:x>0yy=0 
PES ED BE IS 


Entonces, A y B son conjuntos convexos cerrados disjuntos, pero no se pueden separar es- 
trictamente mediante un hiperplano (recta en R?). Véase la figura 4. Así, el problema de 
separar (o de separar estrictamente) dos conjuntos con un hiperplano es más complicado 
de lo que parece. 








FIGURA 4 Conjuntos convexos cerrados 
disjuntos. 


Hay muchas condiciones interesantes sobre los conjuntos A y B que implican la existen- 
cia de un hiperplano de separación, pero los siguientes dos teoremas son suficientes para esta 
sección. La demostración del primer teorema requiere de un poco de material preliminar? 
pero el segundo es consecuencia inmediata del primero. 


TEOREMA 12 Suponga que A y B son conjuntos convexos no vacíos tales que A es compacto y B 
es cerrado. Entonces, existe un hiperplano H que separa estrictamente A y B si y solo 
siA N B = Ø. 

TEOREMA 13 Suponga que A y B son conjuntos compactos no vacíos. Entonces, existe un hiperplano 


que separa estrictamente A y B si y solo si (conv A) N (conv B) = Ø. 


3 Una demostración del teorema 12 se presenta en Steven R. Lay, Convex Sets and Their Applications (Nueva York: 
John Wiley & Sons, 1982; Mineola, NY: Dover Publications, 2007), pp. 34-39. 


8.4 EJERCICIOS 


1. Sea L la recta en R? que pasa por los puntos [74] y $ | 2. Sea L la recta en R? que pasa por los puntos A y [+ 
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DEMOSTRACIÓN Suponga que (conv A) N (conv B) = Ø. Como la envolvente convexa de 
un conjunto compacto es compacta, entonces el teorema 12 asegura que existe un hiperplano 
H que separa estrictamente conv A y conv B. Es claro que H también separa estrictamente 
a los conjuntos más pequeños A y B. 

A la inversa, suponga que el hiperplano H = [f : d] separa estrictamente A y B. Sin pér- 
dida de generalidad, suponga que f(A) < d y f(B) > d. Sea x = cX; + +t + CkXg cualquier 
combinación convexa de elementos de A. Entonces, 


FA) = a fO) HH cef Ok) < cd +t cd = d 
ya que cı + + + ck = 1. Por lo tanto, f(conv A) < d. Asimismo, f(conv B) > d, por lo que 


H = [f : d] separa estrictamente conv A y conv B. De acuerdo con el teorema 12, conv A 
y conv B deben ser disjuntos. E 


EJEMPLO 8 Sean 


=3 3 1 
a; = 1 , &2 = 2 , d3= 4 , bi = 0 y b, = —-1 5 
1 1 0 2 2 


y sean A = [aj, a, az) y B = {b;, b2}. Demuestre que el hiperplano A = [f : 5], donde 
JFGc1, xa, x3) = 2x1 — 3x2 + x3, no separa A y B. ¿Existe un hiperplano paralelo a H que se- 
pare A y B? ¿Se intersecan las envolventes convexas de A y B? 


SOLUCIÓN Evalúe la funcional lineal fen cada uno de los puntos en A y B: 
fa)=2, fa)=-11, fas)=-6, f(by)=4 y f(b,)=12 


Como f(b,) = 4 es menor que 5 y f(b,) = 12 es mayor que 5, los puntos de B están en ambos 
lados de H = [f: 5] y así H no separa A y B. 

Puesto que f(A) < 3 y £(B) > 3, el hiperplano paralelo [f : 3] separa estrictamente A 
y B. Según el teorema 13, (conv A) N (conv B) = Ø. 

Precaución: Si no hay hiperplanos paralelos a H que separen estrictamente A y B, esto 
no implicaría necesariamente la intersección de sus envolventes convexas. Tal vez algún otro 
hiperplano no paralelo a H los separara estrictamente. E 


PROBLEMA DE PRÁCTICA 


1 —1 1 —2 
Sean p; = | 0 |, p, = 2 |, n = 1 |, m = 1 |, y considere que H; es el hi- 
2 1 —2 3 


perplano (plano) en R? que pasa por el punto pı y que tiene vector normal nı, y Hz es el 
hiperplano que pasa por el punto p2 con vector normal nz. Dé una descripción explícita de 
Hı N H, mediante una fórmula que muestre cómo generar todos los puntos en Hı N H2. 


1 -1 


Encuentre una funcional lineal f y un número real d tales que Obtenga una funcional lineal f y un número real d tales que 


L=[f:d]. 


L=[f:d]. 
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En los ejercicios 3 y 4, determine si cada conjunto es abierto o cerra- 
do, o bien, ni abierto ni cerrado. 


3. 


a) [(x y): 
b) [(x, y): 
Cc) [(%, y): 
d) [(x y): 
e) [Gx y): 


y>0) 
x=2y1=yX<3) 
x=2y1<y<3) 
xy=1yx>0) 
xy=1lyx>0) 


a) ((x,y):132+ y?=1) 


b) (œ, y): +y > 1} 

o) (y): x+y S lyy>0) 
d) (œ, y): y= x°} 

e) (x,y): y <x?) 





En los ejercicios 5 y 6, determine si cada conjunto es compacto o no, 
y si es convexo o no. 


5. 
6. 


Utilice los conjuntos del ejercicio 3. 


Utilice los conjuntos del ejercicio 4. 


En los ejercicios 7 a 10, sea H el hiperplano que pasa por los pun- 
tos mencionados. a) Encuentre un vector n que sea normal al hiper- 
plano. b) Obtenga una funcional lineal f y un número real d tales que 


H= 


7. 


11. 


12. 


[f: d]. 
1 2 —1 1 4 7 
11,1 4ļ,| —2 8 —2 |,| —2 |, | —4 
3 1 5 1 3 4 
1 2 1 1 
0 3 2 1 
1pPp1ipp21] 1 
0 0 0 1 
1 2 1 3 
2 2 3 2 
0pP|-1p12]|] —1 
Lol Ls] [7] Las] 
1 2 0 —2 
s E 3 1 ael E 0 
ean p 1 n= 5 y = 1 H= 1 
2 -1 1 3 


1 
4 . 4 
A H el hiperplano en R* con normal n y que 


4 


pasa por p. ¿Cuáles de los puntos vı, V2 y V3 están sobre un 
mismo lado de H como el origen, y cuáles no? 


2 3 -1 0 
Sean a = —1 E = 1 , 3 = 6 , b; = 5 y 
5 3 0 -1 
1 2 3 
b=!|-3|, b=|2 y n= 1 |, yseanA = (ay, 
—2 1 —2 


a, a3) y B = {b;, b2, b3}. Encuentre un hiperplano H con nor- 


13. 


14. 


mal n que separa A y B. ¿Existe un hiperplano paralelo a H que 
separe estrictamente A y B? 


A 


2 
Sean p; = ie Sjak "M=/j2|Y 
JO LA 
2 


n, = 1 


3 , sean H; el hiperplano en R4 que pasa por pı con 
s] 


normal nı, y H el hiperplano que pasa por pz con normal nz. 
Dé una descripción explícita de Hı N H2. [Sugerencia: Obtenga 
un punto p en Hı NM A) y dos vectores linealmente indepen- 
dientes v¡ y v2 que generen un subespacio paralelo al plano afín 
bidimensional A; N A]. 


Sean F y F» planos tetradimensionales en RÍ y suponga que F; 
N Fz + Ø. Cuáles son las posibles dimensiones de F; N F3? 


En los ejercicios 15 a 20, escriba una fórmula para una funcional 
lineal f y especifique un número d, tal que [f : d] sea el hiperplano 
descrito en el ejercicio. 


15. 


16. 


pa 


18. 


19. 


20. 


7. 


Sea A la matriz [1 —3 4 —2] de 1 x 4, y sea b = 5. Además, 
H = {xen Rt : Ax = b}. 


Sea A la matriz de [2 5 —3 O 6] de 1 x 5. Observe que Nul A 
está en R’. Sea H = Nul A. 


Sea H el plano en R3 generado por las filas de B = 


E a Al! Es decir, H = Fil B. [Sugerencia: Indague 


cuál es la relación entre H y Nul B. Véase la sección 6.1]. 


Sea H el plano en R? generado por las filas de B = 


| l Ea | Es decir, H = Fil B. 


0-2 8 
1 0 
Sea H el espacio columna de la matriz B = 4 2 
—7 —6 


Es decir, H = Col B. [Sugerencia: Indague cuál es relación entre 
Col B y Nul B7. Véase la sección 6.1]. 


1 0 
Sea H el espacio columna de la matriz B = So 2R 
—4 —4 


Es decir, H = Col B. 


En los ejercicios 21 y 22, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


21. 


a) Una transformación lineal de R a R” se llama una funcio- 
nal lineal. 


b) Si f es una funcional lineal definida en R”, entonces existe 
un número real k tal que f(x) = kx para toda x en R”. 


c) Si un hiperplano separa estrictamente a los conjuntos A y B, 
entonces A N B = Ø. 


d) Si A y B son conjuntos convexos cerrados y A N B = Ø, 
entonces existe un hiperplano que separa estrictamente 
A y B. 


22. 


23. 


24. 


a) Si d es un número real y f es una funcional lineal diferen- 
te de cero definida en [R”, entonces [f : d] es un hiperplano 
en R”. 


b) Dado cualquier vector n y cualquier número real d, el con- 
junto (x : n-x = d) es un hiperplano. 


Cc) Si A y B son conjuntos disjuntos no vacíos tales que A es 
compacto y B es cerrado, entonces existe un hiperplano que 
separa estrictamente A y B. 


d) Si existe un hiperplano H tal que H no separa estrictamente 
a dos conjuntos A y B, entonces (conv A) N (conv B) 4 Ø. 


1 3 5 4 
senvi =| h= lohe] eih Encuen- 


tre un hiperplano [f : d] (en este caso, una recta) que separe 
estrictamente p de conv {V1, V2, V3}. 


Repita el ejercicio 23 para vı = E vV = El v = H 


peli 


25. 


26. 


27. 


28. 


29. 


30. 
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Sea p = Ml Encuentre un hiperplano [f : d] que separe es- 


trictamente B(0, 3) y B(p, 1). [Sugerencia: Después de encon- 
trar f, demuestre que el punto v = (1 — .75)0 + .75p no está 
en B(0, 3) ni en B(p, 1)]. 


Sean q = [5] yp= p Encuentre un hiperplano [f : d] 
que separe estrictamente B(q, 3) y B(p, 1). 


Dé un ejemplo de un subconjunto cerrado § de R? tal que 
conv S no sea cerrado. 


Dé un ejemplo de un conjunto compacto A y un conjunto ce- 
rrado B en R? tales que (conv A) N (conv B) = Ø, pero con- 
siderando que A y B no se puedan separar estrictamente con 
un hiperplano. 


Pruebe que la bola abierta B(p, 8) = {x : |x — pll < 9) es un 
conjunto convexo. [Sugerencia: Utilice la desigualdad del 
triángulo]. 


Demuestre que la envolvente convexa de un conjunto acotado 
también está acotada. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Primero, calcule n¡-p; = 


—3 y mp2 = 7. El hiperplano H, es el conjunto solución de 


la ecuación xı + x2 — 2x3 = —3, y Ho es el conjunto solución de la ecuación —2x] + x2 + 


3x3 = 7. Entonces, 


Hı N H; = {x : x1 + x2 — 2x3 = —3 y 2x1 + x2+ 3x3 = 7) 


Esta es una descripción implícita de Hı N Hz. Para encontrar una descripción explícita, 
resuelva el sistema de ecuaciones por reducción de filas: 


E r i TE 
—2 1 1 1 
r 0 l=; 3 

—10 5 

3 3 

O AS E = = 1 =,| :L 

Por lo tanto, xı = — 3 + 3X3,X2 = 3 + 3X3,X3 = X3. Sean p = SS 

0 1 


La solución general se puede escribir como x = p + x3v. Así, Hı N H; es la recta que pasa 
por p en la dirección de v. Observe que v es ortogonal tanto a n; como a nz. 


8.5 | POLÍTOPOS 


Esta sección estudia propiedades geométricas de una importante clase de conjuntos convexos 
compactos llamados polítopos. Esos conjuntos se presentan en todo género de aplicaciones, 
incluyendo teoría de juegos, programación lineal y problemas de optimización más genera- 
les, como el diseño de controles de retroalimentación para sistemas de ingeniería. 
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DEFINICIÓN 


DEFINICIÓN 


Un polítopo en R” es la envolvente convexa de un conjunto finito de puntos. En R?, 
un polítopo es simplemente un polígono. En [R3, un polítopo se llama poliedro. Caracterís- 
ticas importantes de un poliedro son sus caras, aristas y vértices. Por ejemplo, el cubo tiene 
6 caras cuadradas, 12 aristas y 8 vértices. Las siguientes definiciones aportan terminología 
para mayores dimensiones, así como para R? y R*. Recuerde que la dimensión de un con- 
junto en R” es la dimensión del plano afín más pequeño que lo contiene. Además, observe 
que un polítopo es un tipo especial de conjunto convexo compacto, porque un conjunto fi- 
nito en R” es compacto y la envolvente convexa de este conjunto también es compacta, de 
acuerdo con el teorema incluido en el recuadro de términos y hechos en topología, de la 
sección 8.4. 


Sea $ un subconjunto convexo compacto de [R”. Un subconjunto F no vacío de S es 
una cara (propia) de S si F + S y existe un hiperplano H = [f : d] tal que F = S$ N H 
y f(S) S d o f(S) = d. El hiperplano H es un hiperplano de soporte para S. Si la di- 
mensión de F es k, entonces F es una k-cara de S. 

Si P es un polítopo de dimensión k, entonces P se llama un k-polítopo. Una 0-cara 
de P se llama vértice, una 1-cara es una arista, y una (k — 1)-dimensional cara es una 
faceta de S. 


EJEMPLO 1 Suponga que S es un cubo en [R?. Cuando un plano H se traslada en R? 
hasta que apenas toca (soporta) al cubo, pero no corta el interior de este, entonces hay tres 
posibilidades para H N S, dependiendo de la orientación de H. (Véase la figura 1). 

H N S puede ser una cara cuadrada bidimensional (faceta) del cubo. 


H N S puede ser una arista unidimensional del cubo. 


H N S puede ser un vértice de dimensión 0 del cubo. E 


A 


E 





BN Ses bidimensional. H N S es unidimensional. H N S es de dimensión 0. 


FIGURA 1 


La mayoría de las aplicaciones de polítopos de alguna manera implican a los vértices, 
porque estos tienen una propiedad especial que se identifica en la siguiente definición. 


Sea S un conjunto convexo. Un punto p en S es un punto extremo de S si p no está 
en el interior de algún segmento de recta contenido en S. Más precisamente, si X, 
y e Sy p ex, entonces p = x o p = y. El conjunto de todos los puntos extremos 
de S se llama perfil de S. 


H q. 


FIGURA 2 


DEFINICIÓN 


TEOREMA 14 
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Un vértice de cualquier conjunto convexo S compacto es automáticamente un punto ex- 
tremo de S. Este hecho queda asentado en la demostración del teorema 14, que se presenta 
a continuación. Al trabajar con un polítopo, por ejemplo, P = conv [v;,..., Vx) para v1,..., Ve 
en R”, por lo general es útil saber que v;,..., v son los puntos extremos de P. Sin embar- 
go, esta lista podría contener puntos extraños. Es decir, por ejemplo, algún vector v; podría 
ser el punto medio de una arista del polítopo. Desde luego, en este caso v; realmente no se 
necesita para generar la envolvente convexa. La siguiente definición describe la propiedad 
de los vértices que hace que sean puntos extremos. 


El conjunto (v;,..., Vx) es una representación mínima del polítopo P si P = conv 
[v1,..., Vx) y para cada i = 1,..., k, v; g conv {v;: j 41). 


Cada polítopo tiene una representación mínima. Si P = conv {v1,..., Vg} y si alguna v; 
es una combinación convexa de los otros puntos, entonces es posible eliminar v; del conjunto 
de puntos sin cambiar la envolvente convexa. Este proceso se puede repetir hasta obtener la 
representación mínima. Es factible demostrar que la representación mínima es única. 


Suponga que M = {v1,..., Vg} es la representación mínima del polítopo P. Entonces 
los siguientes tres enunciados son equivalentes: 


a) pe M. 
b) p es un vértice de P. 


c) pes un punto extremo de P. 


DEMOSTRACIÓN a)= b). Suponga que p e M y sea Q = conv {v : v e M y v + p}. De la 
definición de M se deduce que p £ O, y como Q es compacto, el teorema 13 implica la exis- 
tencia de un hiperplano HA” que separa estrictamente [p) y O. Sea H el hiperplano que pasa 
por p paralelo a H”. Véase la figura 2. 

Entonces O está en uno de los semiespacios cerrados H* acotado por H, y PC H*. 
Por lo tanto, A es soporte para P en p. Además, p es el único punto de P que puede estar 
en H, de manera que H N P = {p}, y p es un vértice de P. 

b) = c). Sea p un vértice en P. Entonces existe un hiperplano H = [f : d] tal que H N 
P = {p} y f(P) = d. Si p no fuera un punto extremo, entonces se tendrían puntos x y y en P 
tales que p = (1 — c)x + cy con 0 < c < 1. Es decir, 


y=p=U0-ox y y=(2)0-(2-1)0 


Se deduce que f(y) = 10) — (G — 1) f(x). Pero, f(p) = d y f(X) = d, por lo que 


JY) < Go E G 2 i)o) =i 


Por otro lado, y e P, así que f(y) = d. Se deduce que f(y) = d y que y e H N P. Esto con- 
tradice el hecho de que p es un vértice. Entonces, p debe ser un punto extremo. (Observe 
que esta parte de la demostración no depende de que P sea un polítopo. Es válida para cual- 
quier conjunto convexo compacto). 

c) = a). Es claro que cualquier punto extremo de P debe ser un miembro de M. E 
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TEOREMA 15 


TEOREMA 16 


EJEMPLO 2 Recuerde que el perfil de un conjunto S es el conjunto de puntos extremos 
de S. El teorema 14 muestra que el perfil de un polígono en R? es el conjunto de vértices. 
(Véase la figura 3). El perfil de una bola cerrada es su frontera. Un conjunto abierto no tiene 
puntos extremos, de manera que su perfil es vacío. Un semiespacio cerrado no tiene puntos 
extremos, por lo que su perfil es vacío. E 


FIGURA 3 


El ejercicio 18 le pide demostrar que un punto p en un conjunto convexo $ es un punto 
extremo de $ si, y solo si, cuando p se elimina de S, los puntos restantes aún siguen forman- 
do un conjunto convexo. Se deduce que si $* es cualquier subconjunto de S tal que conv S* es 
igual a S, entonces S* debe contener el perfil de S. Los conjuntos del ejemplo 2 muestran que, 
en general, $* puede ser más grande que el perfil de S. Sin embargo, es cierto que cuando S 
es compacto, $* se puede considerar como el perfil de S, como lo demostrará el teorema 15. 
Así, cada conjunto $ compacto no vacío tiene un punto extremo, y el conjunto de todos los 
puntos extremos es el subconjunto más pequeño de S cuya envolvente convexa es igual a S. 


Sea S un conjunto convexo compacto no vacío. Entonces S es la envolvente convexa 
de su perfil (el conjunto de puntos extremos de S$). 


DEMOSTRACIÓN La demostración es por inducción sobre la dimensión del conjun- 
to S.! H 


Una importante aplicación del teorema 15 es el siguiente teorema. Es uno de los re- 
sultados teóricos clave en el desarrollo de la programación lineal. Las funcionales lineales 
son continuas, y las funciones continuas siempre alcanzan sus máximos y mínimos sobre un 
conjunto compacto. El significado del teorema 16 es que para conjuntos convexos compactos, 
el máximo (y el mínimo) realmente se obtiene en un punto extremo de S. 


Sea f una funcional lineal definida sobre un conjunto convexo S compacto y no vacío. 
Entonces, existen puntos extremos Y y w de S tales que 


1O DI y Ñ) = PAY 


DEMOSTRACIÓN Suponga que f alcanza su máximo m sobre S en algún punto v' en S. 
Es decir, f(v') = m. Se desea demostrar que existe un punto extremo en S con la misma pro- 
piedad. De acuerdo con el teorema 15, v’ es una combinación convexa de los puntos extre- 
mos de S. Es decir, existen puntos extremos V1,..., V de S y no negativos c1,..., Ck tales que 


v= civ Hee + ceg conci +“. +c=1 
Si ninguno de los puntos extremos de S satisface f(v) = m, entonces 


fv)<m parai=1,...,k 


l Los detalles se pueden encontrar en Steven R. Lay, Convex Sets and Their Applications (Nueva York: John Wiley $2 
Sons, 1982; Mineola, NY: Dover Publications, 2007, p. 43. 
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porque m es el máximo de f sobre S. Pero entonces, como f es lineal, 


= f(v) = f(c1v1 +: + ckYk) 
CV) + + ck f (Vk) 
<cm +: +cem = mci +: +c) =m 


3 
l 


Esta contradicción implica que algún punto extremo Y de S debe satisfacer f(Y) = m. 
La demostración para W es similar. E 


0 


conv (pi, P2, p3). Para cada funcional lineal f, encuentre el valor máximo m de f sobre 
el conjunto S, y obtenga todos los puntos x en S en los que f(x) = m. 


EJEMPLO 3 Dados los puntos p; = [o oe. = [| y Pp = [>| en R?, sea S = 


a) fila, a)=x+% b) f(x, x2) = -3x1 + x2 6) f(x,x)=x1 +2x2 
SOLUCIÓN De acuerdo con el teorema 16, el valor máximo se alcanza en uno de los puntos 
extremos de S. Así que para encontrar m, se evalúa f en cada punto extremo y se selecciona 


el valor más grande. 


a) filp) =-—1, fi(p») = 4 y /f1(p3) = 3, de manera que m; = 4. Trace la gráfica de la 
recta f(x], x2) = my, es decir, xy + x2 = 4, y observe que x = p» es el único punto en S 
en el cual f(x) = 4. Véase la figura 4a). 


b) h:i) = 3, P2) = —8 y (p3) = —1, por lo que m, = 3. Trace la gráfica de la recta 
f201, x2) = ma, es decir, —3x1 + x2 = 3, y observe que x = py es el único punto en S en 
el cual f(x) = 3. Véase la figura 4b). 


c) filp) =-—1, filp) =5 y BP) = 5, de manera que m; = 5. Trace la gráfica de la 
recta f3(x1, x2) = m3, es decir, x¡ + 2x2 = 5. Aquí, f3 alcanza su valor máximo en po», 





en p3 y en cada punto de la envolvente convexa de p» y p3. Véase la figura 4c). E 

X2 %2 %2 

4% 4+ 4+ 

P3 P3 P3 
2+ 2/+ 2+ 
rs P2 Y Ss P2 Y Ss p2 
HA HN 1 HA HH — 21 + HN 1 
-2 Pı 2 4 -2 jPi 2 4 -2 Pı 2 4 





a4)x +x,=4 


FIGURA 4 








db) 3x1 +x7=3 C)x1+2x,=5 


La situación ilustrada en el ejemplo 3 para [R? también se aplica en mayores dimensio- 
nes. El valor máximo de una funcional lineal f en un polítopo P está en la intersección de un 
hiperplano soporte y P. Esta intersección es un solo punto extremo de P, o bien, la envolvente 
convexa de 2 o más puntos extremos de P. En cualquier caso, la intersección es un polítopo, 
y sus puntos extremos forman un subconjunto de los puntos extremos de P. 

Por definición, un polítopo es la envolvente convexa de un conjunto finito de puntos. Esta 
es una representación explícita del polítopo porque identifica puntos en el conjunto. Un po- 
lítopo también se puede representar implícitamente como la intersección de un número finito 
de semiespacios cerrados. El ejemplo 4 ilustra esto en R?. 
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EJEMPLO 4 Sean 


e [2 e-[] > [2 


en R?, y S = conv (pi, p», p3). Álgebra sencilla indica que la recta que pasa por pı y p2 
está dada por xı + x2 = 1, y S está en el lado de esta recta donde 


xı +x2 = 1 o, de manera equivalente, —xı — x2 S —1. 
De forma similar, la recta que pasa por p2 y p3 es xı — x2 = 1, y S está sobre el lado donde 
x-—xmo=l 
Además, la recta que pasa por p3 y p¡ es —x¡ + 3x2 = 3, y S se encuentra en el lado donde 
—=x1 + 3x2 = 3 


Véase la figura 5. Se deduce que S se puede describir como el conjunto solución del sistema 
de desigualdades lineales 


—xı — X2 < —1 
xx <l 


—=x1 +3x2<3 


Este sistema se puede escribir como Ax = b, donde 








-=1 -—1 -1 
A=| 1 -1|l, :=[%] y b=| 1 
-1 3 a 3 
Observe que una desigualdad entre dos vectores, tales como Ax y b, se aplica a cada una de 
las coordenadas correspondientes en esos vectores. E 
X 
z x-x=1 
4+ 
P3 
2+ -x + 3x2 =3 
PA g 
(E 2 EE 1 
2 P2 2 4 
x+x=1 
FIGURA 5 


En ocasiones será necesario remplazar una descripción implícita de un polítopo por una 
representación mínima del polítopo, listando todos los puntos extremos del polítopo. En ca- 
sos sencillos, es factible una solución gráfica. El siguiente ejemplo muestra cómo manejar la 
situación cuando varios puntos de interés están muy cercanos para identificarlos fácilmente 
en una gráfica. 


EJEMPLO 5 Sea P el conjunto de puntos en R? que satisfacen Ax = b, donde 


1 3 18 
3> 2 21 


y x = 0. Encuentre la representación mínima de P. 
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SOLUCIÓN La condición x = 0 coloca a P en el primer cuadrante de R?, una condición 
típica en problemas de programación lineal. Las tres desigualdades en Ax < b implican tres 
rectas frontera: 


(1D) xı +3x2=18 (2) xı+x2=8 (3) 3x1 +2x2 =21 


Las tres rectas tienen pendientes negativas, por lo que una idea general de la forma de P es 
fácil de visualizar. Incluso un burdo esquema de las gráficas de esas rectas revelará que (0, 0), 
(7, 0) y (0, 6) son vértices del polítopo P. 

¿Qué ocurre con las intersecciones de las rectas (1), (2) y (3)? A partir de la gráfica, 
algunas veces es claro cuáles intersecciones incluir. Si no es así, el siguiente procedimiento al- 
gebraico funcionará bien: 


Cuando se encuentra un punto de intersección que corresponde a dos desigualdades, 
pruébelo en las otras desigualdades para ver si el punto está en el polítopo. 


La intersección de (1) y (2) es p12 = (3, 5). Ambas coordenadas son no negativas, así que 
p1 satisface todas las desigualdades, excepto quizá la tercera. Pruebe esto: 


3(3) + 25) = 19 < 21 


Este punto de intersección satisface la desigualdad para (3), de manera que p12 está en el 
polítopo. 

La intersección de (2) y (3) es p23 = (5, 3). Esto satisface todas las desigualdades, excep- 
to quizá la desigualdad para (1). Pruebe esto: 


1(5) + 33) = 14< 18 


Esto demuestra que paz está en el polítopo. 
Por último, la intersección de (1) y (3) es p¡3 = (?, 3) Pruebe esto en la desigualdad 
para (2): 


(D+18) =2=8.6>8 


Por lo tanto, p13 no satisface la segunda desigualdad, lo que demuestra que p;3 no está en P. 
En conclusión, la representación mínima del polítopo P es 


ehe hEHEL $ 


El resto de esta sección analiza la construcción de dos polítopos básicos en R? (y ma- 
yores dimensiones). El primero se presenta en problemas de programación lineal. Ambos 
polítopos brindan oportunidades para visualizar R* en una forma notable. 


Simplejo 


Un simplejo es la envolvente convexa de un conjunto finito de vectores afínmente indepen- 
dientes. Para construir un simplejo k-dimensional (o k-simplejo), se procede como sigue: 


0-simplejo S°: un solo punto {v1} 
1-simplejo S!: conv (S% U (v2)), y va no está en aff SO 


2-simplejo S?: conv (S! U {v3}), y v3 no se encuentra en aff S! 


k-simplejo S*: conv (SFT! U (vx+1)), y Vr+1 no está en aff SK! 


El simplejo S! es un segmento de recta. El triángulo $? proviene de seleccionar un punto 
v3 que no está en la recta que contiene a S¡ y después formar la envolvente convexa con $». 
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vi v v v3 
s? s! s2 s3 
FIGURA 6 


(Véase la figura 6). El tetraedro S3 se produce al elegir un punto va que no esté en el plano de 
S? y después formar la envolvente convexa con $°. 

Antes de continuar, considere algunos de los patrones que se están presentando. El 
triángulo $° tiene tres aristas. Cada una de esas aristas es un segmento de recta semejante 
a S!. ¿De dónde provienen esos tres segmentos de recta? Uno de ellos es S!. Otro viene 
de la unión del punto final vz con el nuevo punto vz. El tercero proviene de unir el otro 
punto final vı con v3. Se podría decir que cada punto extremo en S! se estira dentro de un 
segmento de recta en S?, 

El tetraedro S? de la figura 6 tiene cuatro caras triangulares. Una de ellas es el trián- 
gulo original S?, y las otras tres se obtienen al estirar las aristas de 5? al nuevo punto va. 
Además, observe que los vértices de $? se estiran para formar las aristas de S?. Las otras 
aristas de 53 provienen de las aristas de S?. Esto sugiere cómo “visualizar” el S* de cuatro 
dimensiones. 

La construcción de S*, llamado pentatopo, implica formar la envolvente convexa de S* 
con un punto vs que no está en el 3-espacio 5%. Desde luego, es imposible un esquema com- 
pleto, pero la figura 7 es sugestiva: S* tiene cinco vértices, y cualesquiera cuatro de los vér- 
tices determinan una faceta en la forma de un tetraedro. Por ejemplo, la figura enfatiza 
la faceta con vértices v1, V2, V4 y V5 y la faceta con vértices v2, V3, V4 y V5. Hay cinco de estas 


v 


1 v 





viv 





FIGURA 7 El simplejo de cuatro dimensiones S* proyectado sobre [R?, con dos 
facetas tetraédricas resaltadas. 
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facetas. La figura 7 identifica las 10 aristas de S*, las cuales se pueden emplear para visua- 
lizar las 10 caras triangulares. 

La figura 8 muestra otra representación del simplejo de cuatro dimensiones S*. Esta vez 
el quinto vértice se presenta “dentro” del tetraedro S%. Las facetas tetraédricas resaltadas 
también parecen estar “dentro” de $°. 





FIGURA 8 El quinto vértice de S* está “dentro” de $°. 


Hipercubo 


Sea I; = 0e; el segmento de recta del origen 0 al vector e; de la base estándar en R”. Enton- 
ces, para k tal que 1 <= k = n, el vector suma? 


CE=L +b+:"+L 


se llama el hipercubo k-dimensional. 

Para visualizar la construcción de C*, inicie con los casos sencillos. El hipercubo C! es el 
segmento de recta /;. Si C l Se traslada mediante e», la envolvente convexa de sus posiciones 
inicial y final describe un cuadrado C?. (Véase la figura 9 de la página 478). Al trasladar C? 
mediante ez se produce el cubo C?. Una traslación similar de C? mediante el vector e4 produce 
el hipercubo de cuatro dimensiones C?, 

Una vez más, esto es difícil de visualizar, pero la figura 10 muestra una proyección 
bidimensional de C*. Cada una de las aristas de C? se estira para formar una cara cuadrada 
de C*. Y cada cara cuadrada de C? se amplía para formar una cara cúbica de C*. La figura 
11 muestra tres facetas de C*, El inciso a) resalta el cubo proveniente de la cara cuadrada iz- 
quierda de C?. El inciso b) muestra el cubo que proviene de la cara cuadrada frontal de C?. 
Y el inciso c) destaca el cubo proveniente de la cara cuadrada superior de C?. 


2 El vector suma de dos conjuntos A y B se define mediante A + B= [e:c= a + b para algunas a € A y b e B}. 
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Cc! c? c? 
FIGURA 9 Construcción del cubo C?. 





FIGURA 10 C* proyectado sobre R?. 








a) b) c) 
FIGURA 11 Tres de las facetas cúbicas de C*. 


La figura 12 muestra otra representación de C4 en la que el cubo trasladado se coloca 
“dentro” de C?. Esto hace más fácil visualizar las facetas cúbicas de C4, porque existe menos 
distorsión. 





FIGURA 12 La imagen trasladada de 
C? se coloca “dentro” de C? para 
obtener C4. 


En total, el cubo de cuatro dimensiones C* tiene ocho caras cúbicas. Dos de ellas provie- 
nen de las imágenes originales y trasladadas de C?, y seis provienen de las caras cuadradas 
de C? que se amplían para formar cubos. Las caras cuadradas bidimensionales de C* pro- 
vienen de las caras cuadradas de C? y de su traslado, y las aristas de C* que se estiran para 
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formar cuadrados. Por lo tanto, hay 2 x 6 + 12 = 24 caras cuadradas. Para contar las aristas, 
multiplique por dos el número de aristas en C? y sume el número de vértices en C3. Esto 
da 2 x 12 + 8 = 32 aristas en C*. Todos los vértices en C* provienen de C* y su traslado, de 
manera que hay 2 x 8 = 16 vértices. 

Uno de los resultados verdaderamente notables en el estudio de polítopos es la siguiente 
fórmula; Leonard Euler (1707-1783) fue el primero en probarla. La fórmula establece una 
relación sencilla entre el número de caras de diferentes dimensiones en un polítopo. Para 
simplificar el enunciado de la fórmula, sea f;(P) el número de caras k-dimensionales de un 
polítopo n-dimensional P. 


n—1 
Fórmula de Euler: AS) =14 (=D 
k=0 


En particular, cuando n = 3, v — e + f = 2, donde v, e y f denotan el número de vértices, 
aristas y facetas, respectivamente, de P. 


PROBLEMA DE PRÁCTICA 


1. Encuentre la representación mínima del polítopo P definido por las desigualdades 


1 3 12 
Ax=byx=0, cuando A=|1 2jļjyb= 9 
2 1 12 


8.5 EJERCICIOS 


1. A partir de los puntos aslahasi peh] 6. a=; Tasi 


en R?, sea S = conv {p1, P2, p3}. Para cada funcional lineal f, 


1 3 18 
encuentre el valor máximo m de f en el conjunto S, y obtenga ml b=1|10 
todos los puntos x en S en los cuales f(x) = m. 4 f 28 
a) f&a, X2) = x1 — x2 b) fœ x2) =x + 2 
SÍ 2 1 8 
c) fan x2) = -3x +x 
) fŒ, x2) 1 a ] cal dll 
2. Dados los puntos pi =| 9 [p2 = [$ |y ps = | 3 |en me, 1 1 
sea $ = conv {p1, p2, p3}. Para cada funcional lineal f, encuen- 9. Sea S = {(x, y): ae O - 1? < 1) = (G, 0)). ¿El origen 
tre el valor máximo m de f en el conjunto S, y determine todos es un punto extremo de conv S? ¿Es el origen un vértice de 
los puntos x en S en los cuales f(x) = m. conv 5? 
a) f(%1,x2) = x1 + x2 b) fœ x2) =x = x2 10. Encuentre un ejemplo de un conjunto convexo S cerrado en R? 
c) fœ, X2) = —2x1 + x2 tal que su perfil P sea no vacío, pero conv P 4 S. 


3. Repita el ejercicio 1 considerando que m es el valor mínimo 11. Encuentre un ejemplo de un conjunto convexo S acotado en 
de f en S y no el valor máximo. R? tal que su perfil P sea no vacío, pero conv P + S. 


4. Repita el ejercicio 2 considerando que m es el valor mínimo de 2 


Fens isa a . a) Determine el número de k-caras del simplejo de cinco di- 
en S y no el valor máximo. 


mensiones S" para k = 0, 1,..., 4. Verifique que su respuesta 


En los ejercicios 5 a 8, encuentre la representación mínima del po- satisfaga la fórmula de Euler. 
lítopo definido por las desigualdades Ax = b y x = 0. b) Realice una tabla de los valores de f(S”) para n = 1,..., 5 
y k=0, 1,..., 4. ¿Identifica un patrón? Proponga una fórmu- 
i2 10 ; 
5. A= A a la general para fi(S”). 


3 Se presenta una demostración en Steven R. Lay, Convex Sets and Their Applications (Nueva York: John Wiley & 
Sons, 1982; Mineola, NY: Dover Publications, 2007), p. 131. 
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13. 


14. 


15. 


a) Determine el número de k-caras del hipercubo de cinco di- 
mensiones C* para k =0, 1,..., 4. Compruebe que su res- 
puesta satisfaga la fórmula de Euler. 


b) Construya una tabla de los valores de f¿(C”) paran = 1,..., 5 
y k=0, 1,..., 4. ¿Identifica un patrón? Proponga una fórmu- 
la general para f(C”). 


Suponga que vj,..., V¿ son vectores linealmente indepen- 
dientes en R” (1 < k < n). Entonces el conjunto X% = conv 
{£v1,..., E3vx) es un k-polítopo de cruce (u ortoplex). 

a) Elabore un bosquejo de X! y X?. 


b) Determine el número de k-caras del polítopo de cruce tridi- 
mensional X? para k = 0, 1, 2. ¿Qué otro nombre tiene X?? 


c) Obtenga el número de k-caras del polítopo de cruce de cua- 
tro dimensiones X^ para k = 0, 1, 2, 3. Compruebe que su 
respuesta satisfaga la fórmula de Euler. 


d) Encuentre una fórmula para f(X”), el número de k-caras 
de X”, para0 Sks&sn-1. 


Una k-pirámide P* es la envolvente convexa de un (k — 1)- 
polítopo Q y un punto x g aff Q. Encuentre una fórmula 
para cada uno de los siguientes casos en términos de f;(Q), 
j=0,....n— 1. 


a) El número de vértices de P” : £o(P”). 
b) El número de k-caras de P” : fk(P”), para 1 S k Sn — 2. 


c) El número de facetas (n — 


fate. 


1)-dimensionales de P”: 


En los ejercicios 16 y 17, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


16. 


a) Un polítopo es la envolvente convexa de un conjunto finito 
de puntos. 


b) Sea p un punto extremo de un conjunto convexo S. Si u, 
v eS, p € UY y p + u, entonces p = V. 

c) Si S es un subconjunto convexo no vacío de [R”, entonces S 
es la envolvente convexa de su perfil. 


d) El simplejo de cuatro dimensiones S* tiene exactamente 
cinco facetas, cada una de las cuales es un tetraedro tridi- 
mensional. 


17. 


18. 


19. 


20. 


21. 


22. 


a) Un cubo en R? tiene cinco facetas. 


b) Un punto p es un punto extremo de un polítopo P si y solo 
si p es un vértice de P. 

c) Si S es un conjunto convexo, compacto y no vacío, y una 
funcional lineal alcanza su máximo en un punto p, entonces 
p es un punto extremo de S. 


d) Un polítopo bidimensional siempre tiene el mismo número 
de vértices y aristas. 


Sea v un elemento del conjunto convexo S. Pruebe que v es un 
punto extremo de S si y solo si el conjunto (xe S : x + v) es 
convexo. 


Sic e R y S es un conjunto, defina cS = {cx : x e S}. Sea S 
un conjunto convexo y suponga que c > 0 y d > 0. Demuestre 
que cS + dS = (c + d)S. 


Encuentre un ejemplo para demostrar que la convexidad de S 
es necesaria en el ejercicio 19. 


Si A y B son conjuntos convexos, demuestre que A + B es 
convexo. 


Un poliedro (3-polítopo) se llama regular si todas sus facetas 
son polígonos regulares congruentes y todos los ángulos en los 
vértices son iguales. En la siguiente demostración aporte los de- 
talles de que solamente existen cinco poliedros regulares. 


a) Suponga que un poliedro regular tiene r facetas, cada una de 
las cuales es un polígono regular de k lados, y que s aristas 
concurren en cada vértice. Considerando que v y e denotan 
los números de vértices y aristas en el poliedro, explique por 
qué kr = 2e y sv = 2e. 


b) Utilice la fórmula de Euler para demostrar que 
1 $ 1 1l Ş 1 
s k 2 e 


c) Obtenga todas las soluciones integrales de la ecuación en 
el inciso b) que satisfacen las restricciones geométricas del 
problema. (¿Qué tan pequeños pueden ser k y s?). 


Para su información, los cinco poliedros regulares son el tetrae- 
dro (4, 6, 4), el cubo (8, 12, 16), el octaedro (6, 12, 8), el dode- 
caedro (20, 30, 12) y el icosaedro (12, 30, 20). (Los números 
entre paréntesis indican los números de vértices, aristas y caras, 
respectivamente). 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


1. La desigualdad matricial Ax = b conduce al siguiente sistema de desigualdades: 


a) xı + 3x2 S 12 
b) xi+2x=09 
c) 2x1 +x=12 


La condición x = 0 coloca al polítopo en el primer cuadrante del plano. Un vértice es 
(0, 0). Las x¡ de intersección de las tres rectas (cuando x2 = 0) son 12, 9 y 6, por lo 
que (6, 0) es un vértice. Las x, de intersección de las tres rectas (cuando x¡ = 0) son 4, 
4.5, y 12, de manera que (0, 4) es un vértice. 
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¿Cómo hacer que las tres rectas frontera intercepten en valores positivos de x, y x2? 
La intersección de a) y b) está en Pa = (3, 3). Al probar pay en c) se obtiene 2(3) + 163) = 
9 < 12, por lo que Pa está en P. La intersección de b) y c) está en pp. = (5, 2). Al probar 
Poc en a) se obtiene 1(5) + 3(2) = 11 < 12, de manera que pp. está en P. La intersección 
de a) y c) está en Pac = (4.8, 2.4). Al probar Pac en b) se obtiene 1(4.8) + 2(2.4) = 9.6 > 9. 
Así, Pac no está en P. 

Por último, los tres vértices (puntos extremos) de los polítopos son (0, 0), (6, 0), (5, 2), 
(3, 3) y (0, 4). Esos puntos forman la representación mínima de P. Esto se muestra gráfica- 
mente en la figura 13. 








X2 
12+ 
8S+— c) 
aT 
+ p a) 
inaa xı 
4 8 b) 12 
FIGURA 13 


8.6 | CURVAS Y SUPERFICIES 


Durante miles de años, los constructores utilizaron largas tiras delgadas de madera para 
formar el casco de las embarcaciones. En épocas más recientes, los diseñadores emplearon 
tiras metálicas largas y flexibles para formar las superficies de autos y aviones. Pesos y 
clavijas moldearon las tiras en suaves curvas llamadas splines cúbicos naturales. La curva 
entre dos puntos de control sucesivos (clavijas o pesos) tiene una representación paramé- 
trica usando polinomios cúbicos. Por desgracia, dichas curvas tienen la propiedad de que 
el movimiento de un punto de control afecta la forma de toda la curva, debido a las fuerzas 
físicas que las clavijas y los pesos ejercen sobre la tira. Los ingenieros diseñadores habían 
deseado por mucho tiempo tener un gran control local de la curva, de manera que el movi- 
miento de un punto de control afectara solamente una pequeña parte de la curva. En 1962, 
un ingeniero francés especialista en automotores, Pierre Bézier, resolvió este problema 
agregando puntos de control y utilizando una clase especial de curvas, las cuales ahora 
llevan el nombre de su creador. 


Curvas de Bézier 


Las curvas que se describen a continuación desempeñan un papel importante en los gráficos 
generados por computadora y en ingeniería. Por ejemplo, se emplean en Adobe Illustrator y 
en Macromedia Freehand, y en lenguajes de programación como OpenGL. Esas curvas le 
permiten a un programa almacenar información exacta sobre segmentos curvos y superficies 
en un número relativamente pequeño de puntos de control. Todos los comandos de gráficos 
para los segmentos y las superficies solo se tienen que calcular para los puntos de control. La 
estructura especial de esas curvas también acelera otros cálculos en la “tubería de gráficos” 
que crea la imagen final en la pantalla. 

Los ejercicios de la sección 8.3 introdujeron las curvas cuadráticas de Bézier y mos- 
traron un método para construir curvas de Bézier de grado superior. Aquí el análisis se 
concentra en las curvas de Bézier cuadráticas y cúbicas, que se determinan con tres o cuatro 
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puntos de control, denotados como po, P1, p2 y p3. Esos puntos pueden estar en R? o R$, 
o bien, representarse mediante formas homogéneas en R* o R*. Las descripciones paramé- 
tricas estándares de esas curvas, para O = £ < 1, son 


w(t) = (1 —1)po + 21(1 —1)p, + Pp, (1) 
x(1) = (1 — po + 31(1 — 0p, +3 (1 — 1)p, + Cp, (2) 


La figura 1 muestra dos curvas típicas. Por lo regular, las curvas pasan solo a través de los 
puntos de control inicial y final, pero una curva de Bézier siempre está en la envolvente con- 
vexa de sus puntos de control. (Véase los ejercicios 21 a 24 de la sección 8.3). 


P; P2 P; P2 


Po Po P3 


FIGURA 1 Curvas de Bézier cuadráticas y cúbicas. 


Las curvas de Bézier son útiles en los gráficos generados por computadora porque sus 
propiedades esenciales se preservan bajo la acción de transformaciones lineales y traslacio- 
nes. Por ejemplo, si A es una matriz de tamaño adecuado, entonces de la linealidad de la 
multiplicación de matrices, para 0 S t S 1, 


Ax(1) = AQ —1) py + 31(1 — 0)%p, + 31%(1 —1)p, + ¿*ps] 
= (1— 1 Apo + 311 — t) Ap; + 3(1 — 1) Ap, +1 Ap, 


Los nuevos puntos de control son Apo,..., Ap3. En el ejercicio 1 se consideran traslaciones 
de curvas de Bézier. 

Las curvas de la figura 1 sugieren que los puntos de control determinan las rectas tan- 
gentes a las curvas en los puntos de control inicial y terminal. De sus clases de cálculo, recuer- 
de que para cualquier curva paramétrica, por ejemplo y(t), la dirección de la recta tangente 
a la curva en un punto y(t) está dada por la derivada y'(t), llamada vector tangente de la 
curva. (Esta derivada se calcula entrada por entrada). 


EJEMPLO 1 Determine cómo el vector tangente de la curva cuadrática de Bézier w(t) 
está relacionado con los puntos de control de la curva, ent=0y1= 1. 


SOLUCIÓN Escriba los pesos en la ecuación (1) como simples polinomios 
wG) = (1-21 + (2)pp + Qt 21)p, + 1*p, 
Entonces, ya que la derivación es una transformación lineal sobre funciones, 


w(t) = (2 + 21)po + (Q— 40)p, + 21p, 


w"(0) = —2py + 2p, = 2(p¡ — Po) 
w'(1) = —2p; + 2p, = 2(P2 — P1) 
El vector tangente en po, por ejemplo, apunta de po a pı, pero es dos veces más largo que 


el segmento de po a pı. Observe que w'(0) = 0 cuando p; = po. En este caso, w()) =(1 — £) 
p¡ + 1?p», y la gráfica de w(1) es el segmento de recta de p; a p2. E 
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Conexión de dos curvas de Bézier 


Dos curvas de Bézier básicas se pueden unir extremo con extremo, con el punto terminal 
de la primera curva x(£) como el punto inicial p> de la segunda curva y(1). Se dice que la cur- 
va combinada tiene continuidad geométrica G? (en p2) porque los dos segmentos se juntan 
en p2. Si la recta tangente a la curva 1 en pz tiene diferente dirección que la recta tangente 
a la curva 2, entonces una “esquina”, o un cambio abrupto de dirección, puede ser eviden- 
te en p2. Véase la figura 2. 


P39 P, 


P 
1 P> 


Po 
FIGURA 2 Continuidad G/ en p». 


Para evitar un doblez pronunciado, es suficiente ajustar las curvas para que tengan lo 
que se llama continuidad geométrica G*, donde ambos vectores tangentes en pz apuntan en 
la misma dirección. Es decir, las derivadas x'(1) y y'(0) apuntan en la misma dirección, 
aunque pueden diferir en magnitud. Cuando los vectores tangentes son realmente iguales 
en p2, el vector tangente es continuo en p», y se dice que la curva combinada tiene conti- 
nuidad C?, o continuidad paramétrica C?. La figura 3 muestra continuidad G! en a) y con- 
tinuidad C! en b). 











P eoo = Pp 
2l 1 Pp, P3 1 Pp, P3 
Po Po P4 
P 
0 q H | 
0 2 4 6 8 10 12 14 
a) b) 


FIGURA 3 a) Continuidad G! y b) continuidad C!. 


EJEMPLO 2 Considere que x(t) y y(t) determinan dos curvas cuadráticas de Bézier, 
con puntos de control (po, pi, P2) Y [P», P3, P4), respectivamente. Las curvas se unen en 
p> = x(1) = y(0). 


a) Suponga que la curva combinada tiene continuidad G! (en p»). ¿Qué restricción alge- 
braica hace que esta condición se imponga sobre los puntos de control? Exprese esta 
restricción en lenguaje geométrico. 


b) Repita el inciso a) para continuidad C!. 


SOLUCIÓN 


a) A partir del ejemplo 1, x'(+) = 2(p2 — Pp1). Además, utilizando los puntos de control para 
y(c) en lugar de w(s), el ejemplo 1 indica que y'(0) = 2(p3 — p»). La continuidad G! sig- 
nifica que y'(0) = kx'(1) para alguna constante positiva k. De forma equivalente, 


P3 — P2 = k(p2 — p1), conk>0 (3) 
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Geométricamente, (3) implica que p» está sobre el segmento de recta de p; a p3. Para 
probar esto, sea 1 = (k + 1)”, y observe que O < 1 < 1. Despeje k, para obtener k = 
(1 — £)/t. Cuando esta expresión para k se emplea en la ecuación (3), un reordenamiento 
indica que p = (1 — £)p¡ + £ p3, lo que comprueba la afirmación acerca de p». 

b) La continuidad C' significa que y'(0) = x'(1). Por lo tanto, 2(p3 — p2) = 22 — pı), 
de manera que p3 — p2 = P2 — Pi, Y P2 = (Pı + p3)/2. Geométricamente, p2 es el 
punto medio del segmento de recta de pı a p3. Véase la figura 3. E 


La figura 4 muestra la continuidad C! para dos curvas cúbicas de Bézier. Observe cómo 
el punto que une los dos segmentos de recta está a la mitad del segmento de recta entre los 
puntos de control adyacentes. 


p 
0 P, — A 


x(t) 
yO P; 


P: 


P6 


FIGURA 4 Dos curvas cúbicas de Bézier. 


Dos curvas tienen continuidad (paramétrica) C? cuando tienen continuidad C! y las se- 
gundas derivadas x”(1) y y”(0) son iguales. Esto es posible para curvas cúbicas de Bézier, 
pero limita severamente las posiciones de los puntos de control. Otra clase de curvas cúbicas, 
llamadas B-splines, siempre tienen continuidad C? porque cada par de curvas comparte tres 
puntos de control en lugar de uno. Los gráficos que utilizan B-splines tienen más puntos de 
control y, en consecuencia, requieren más cálculos. Algunos ejercicios de esta sección exa- 
minan esas curvas. 

De manera sorprendente, si x(t) y y(t) se unen en p3, la suavidad aparente de la curva 
en ps, por lo general, es la misma para continuidad G! y continuidad C!. Esto se debe a que 
la magnitud de x'(£) no está relacionada con la forma física de la curva. La magnitud solo 
refleja la parametrización matemática de la curva. Por ejemplo, si una nueva función vectorial 
z(t) es igual a x(2£), entonces el punto z(f) atraviesa la curva de po a p3 dos veces más rápido 
que la versión original, porque 2f alcanza 1 cuando t es .5. Pero, de acuerdo con la regla de 
la cadena de cálculo, z'(1) = 2-x"(2£), por lo que el vector tangente a z(t) en pz es el doble 
del vector tangente a x(t) en p3. 

En la práctica, muchas curvas de Bézier sencillas se unen para crear objetos gráficos. 
Los programas de composición tipográfica constituyen una importante aplicación, porque 
muchas letras en un tipo de fuente implican segmentos curvos. Cada letra en letra Post- 
Script%, por ejemplo, se almacena como un conjunto de puntos de control, junto con infor- 
mación sobre cómo construir el “contorno” de la letra utilizando segmentos de recta y cur- 
vas de Bézier. El aumento de dicha letra básicamente requiere multiplicar las coordenadas 
de cada punto de control por un factor de escala constante. Una vez que se ha calculado el 
contorno de la letra, se rellenan las partes sólidas adecuadas de la letra. La figura 5 ilustra 
esto para un carácter de una letra PostScript. Observe los puntos de control. 
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FIGURA 5 Un carácter PostScript. 


Ecuaciones matriciales para curvas de Bézier 


Como una curva de Bézier es una combinación lineal de puntos de control utilizando polino- 
mios como pesos, la fórmula para x(t) se puede escribir como 


a- 
3t — 1? 
x(t) =[po Pi Pz Pa] oO 
(3 
1 — 31 +31? — £? 
31 — 61? + 31% 
= [Po Pi P2 ps] 312 — 313 
t? 
1 —3 3 —1 1 
0 3—6 3 t 
=[|P Pi P ps] 0 0 3 3 t2 
0 0 0 1 t 


La matriz cuyas columnas son los cuatro puntos de control es la matriz de geometría, 
G. La matriz de 4 x 4 de coeficientes polinomiales es la matriz base de Bézier, Mg. Si u(t) 
es el vector columna de potencias de f, entonces la curva de Bézier está dada por 


x(t) = GMpuít) (4) 


Otras curvas cúbicas paramétricas en gráficos de computadora también se escriben en 
esta forma. Por ejemplo, si las entradas en la matriz Mg se cambian adecuadamente, las cur- 
vas resultantes son B-splines. Estas son “más suaves” que las curvas de Bézier, pero no pasan 
por ninguno de los puntos de control. Una curva cúbica de Hermite se presenta cuando la 
matriz Mg se remplaza por una matriz base de Hermite. En este caso, las columnas de la ma- 
triz de geometría consisten en los puntos inicial y final de las curvas y los vectores tangentes 
a las curvas en esos puntos.! 

La curva de Bézier en la ecuación (4) se puede “factorizar” de otra manera, para utili- 
zarse en el análisis de superficies de Bézier. Por conveniencia más adelante, el parámetro t 


1 El término matriz base viene de las filas de la matriz que listan los coeficientes de los polinomios de mezclado 
utilizados para definir la curva. Para una curva de Bézier cúbica, los cuatro polinomios son (1 — 9,31 — 1, 
3121 — £), y t%. Estos forman una base para el espacio [Pz de polinomios de grado 3 o menor. Cada entrada en el 
vector X(f) es una combinación lineal de esos polinomios. Los pesos provienen de las filas de la matriz de geome- 
tría G en la ecuación (4). 
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se remplaza por un parámetro s: 


Po 1 0 0 0||po 
Es TuyT| P| 2 31| 73 3 0 0 Pı 
x(s) = u(s) Mz E =|1i s s s] a aio 
Po 
=[0-s} 381-5) 3%(1-s) s`] > (5) 
2 
P3 


Esta fórmula no coincide plenamente con la transpuesta del producto de la derecha 
en (4), porque x(s) y los puntos de control se presentan en la ecuación (5) sin los símbolos 
de transpuesta. La matriz de los puntos de control en la ecuación (5) se llama el vector de 
geometría. Esto se debería ver como un bloque matricial de 4 x 1 (particionado) cuyas 
entradas son vectores columnas. La matriz a la izquierda del vector de geometría, en la se- 
gunda parte de la ecuación (5), también se puede considerar como un bloque matricial, con 
un escalar en cada bloque. La multiplicación de matrices particionadas tiene sentido, por- 
que cada entrada (vector) en el vector de geometría se puede multiplicar por la izquierda 
por un escalar, así como por una matriz. Por lo tanto, el vector columna x(s) se representa 
mediante la ecuación (5). 


Superficies de Bézier 


Un parche superficial bicúbico en 3D se puede construir a partir de un conjunto de cuatro 
curvas de Bézier. Considere las cuatro matrices de geometría 


[Pi Pp Pi Pra] 
[Pa P2 P23 Pa] 
[P3 Pa P33 P34] 
[Pa Py Pa Pa] 


y recuerde de la ecuación (4) que una curva de Bézier se produce cuando cualquiera de esas 
matrices se multiplica por la derecha por el siguiente vector de pesos: 


(1-1 

Y 

soto = 297 
3 


t 


Sea G el bloque matricial (particionado) de 4 x 4 cuyas entradas son los puntos de con- 
trol p;; presentados antes. Entonces, el siguiente producto es un bloque matricial de 4 x 1, 
y cada entrada es una curva de Bézier: 


Pu Pi Pr Pu a- D 
Di P2 P2 Pa 3t(1—t) 
GMpgu(t) = 
3u() P31 Pza P33 P34 3(1 —1) 
Pa Po Po Pas t? 


N 


De hecho, 


(= tPPpu +30- tph + 3P — tpi + Pa 
(1 —1Yp,, + 31(1 — Pa + 3P — 1)p23 + Pa 
GMpgu(t) = 
sult) d- Pa +3H1= Pa + 340 —1)p33 + Ps 
(1 — 1) Par + 31(1 — 1) Py + 31401 — 1)P43 + iPas 
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Ahora fije t. Así, GMgu(t) es un vector columna que se puede utilizar como un vector de 
geometría en la ecuación (5) para una curva de Bézier en otra variable s. Esta observación 
produce la superficie bicúbica de Bézier: 


x(s,t) = u(s) Mi GMpgu(o), donde 0 < s,t =S 1 (6) 


La fórmula para x(s, f) es una combinación lineal de los 16 puntos de control. Si uno ima- 
gina que esos puntos de control están acomodados en un arreglo rectangular más o menos 
uniforme, como en la figura 6, entonces la superficie de Bézier se controla con una red de 
ocho curvas de Bézier, cuatro en la “dirección s” y cuatro en la “dirección t”. La superfi- 
cie realmente pasa por los cuatro puntos de control en sus “esquinas”. Cuando está a la 
mitad de una superficie más grande, la superficie de 16 puntos comparte con sus vecinos sus 
12 puntos de control frontera. 


FIGURA 6 Dieciséis puntos de control para un 
parche superficial bicúbico de Bézier. 


Aproximaciones a curvas y superficies 


En programas CAD y en los que se utilizan para crear juegos computacionales realistas, el 
diseñador con frecuencia labora en una estación de trabajo gráfica para crear una “escena” 
que implica varias estructuras geométricas. Este proceso requiere interacción entre el dise- 
ñador y los objetos geométricos. Cada leve reposicionamiento de un objeto requiere nuevos 
cálculos matemáticos por el programa de gráficos. Las curvas y superficies de Bézier son 
útiles en este proceso porque implican mucho menos puntos de control que objetos aproxi- 
mados por bastantes polígonos. Esto reduce notablemente el tiempo de cálculo y acelera el 
trabajo del diseñador. 

Sin embargo, después de la composición de la escena, la preparación de la imagen final 
tiene diferentes demandas computacionales que se logran con mayor facilidad mediante ob- 
jetos que consisten en superficies planas y aristas rectas, como los poliedros. El diseñador 
necesita generar la escena, introduciendo iluminación, agregando color y textura a las super- 
ficies, y simulando reflexiones en las superficies. 

Calcular la dirección de la luz reflejada en un punto p sobre una superficie, por ejemplo, 
requiere saber las direcciones de la luz incidente y de la normal superficial, esto es, el vector 
perpendicular al plano tangente en p. Determinar estos vectores normales es mucho más fácil 
sobre una superficie compuesta de, por ejemplo, pequeños polígonos planos que sobre una 
superficie curva cuyo vector normal cambia continuamente conforme se mueve p. Si p;, P2 
y p3 son vértices adyacentes de un polígono plano, entonces la normal superficial es más o 
menos el producto cruz (p2 — p1) x (p2 — p3). Cuando el polígono es pequeño, solo se nece- 
sita un vector normal para reproducir el polígono entero. Además, dos rutinas de sombreado 
ampliamente utilizadas, el sombreado Gouraud y el sombreado Phong, requieren una super- 
ficie para definirse mediante polígonos. 

Como resultado de esa necesidad de superficies planas, ahora las curvas y superficies 
de Bézier de la etapa de composición de escenas generalmente se aproximan mediante seg- 


488 CAPÍTULO 8 Geometría de espacios vectoriales 


mentos de líneas rectas y superficies poliédricas. La idea básica para aproximar una curva o 
superficie de Bézier es dividir la curva o superficie en partes más pequeñas, con más y más 
puntos de control. 


Subdivisión recursiva de curvas y superficies de Bézier 


La figura 7 muestra los cuatro puntos de control po,..., p3 para una curva de Bézier, junto con 
puntos de control para dos nuevas curvas, cada una de las cuales coincide con la mitad de la 
curva original. La curva “izquierda” inicia en o = Po y termina en q3, en el punto medio de 
la curva original. La curva “derecha” comienza en ro = Q3 y termina en r3z = p3. 


Py 8 Pa 


Po = 4o 


FIGURA 7 Subdivisión de una curva de Bézier. 


La figura 8 muestra cómo los nuevos puntos de control encierran regiones que son “más 
delgadas” que la región encerrada por los puntos de control originales. Conforme las dis- 
tancias entre los puntos de control disminuyen, los puntos de control de cada segmento de 
curva también se hacen más cercanos a un segmento de recta. Esta propiedad de variación- 
disminución de las curvas de Bézier depende del hecho de que una curva de Bézier siempre 
está en la envolvente convexa de los puntos de control. 








Po = do P3 =T3 


FIGURA 8 Envolventes convexas de los puntos de control. 


Los nuevos puntos de control están relacionados con los puntos de control originales me- 
diante fórmulas sencillas. Desde luego, qo = Po y r3 = p3. El punto medio de la curva original 
x(1) se encuentra en x(.5) cuando x(1) tiene la parametrización estándar. 


x(1) = (1-31 + 3 —1%)p, + (31 — 62 + 31%)p, + (31? — 315)p, + 1*p, (7) 
para 0 = 1 <= 1. Así, los nuevos puntos de control q3 y ro están dados por 
q; = ro = x(.5) = (Po + 3p, + 3p, + P3) (8) 


También son sencillas las fórmulas para los restantes puntos de control “interiores”, pero la 
deducción de las fórmulas requiere algún trabajo que implica vectores tangentes de las curvas. 
Por definición, el vector tangente a una curva parametrizada x(1) es la derivada x'(1). Este vec- 
tor muestra la dirección de la recta tangente a la curva en x(£). Para la curva de Bézier en (7), 


Xx (1) = (3 + 61 — 34)po + (3— 121 + 91?)p, + (61 — 91?)p, + 31?p, 
para O = 1 <= 1. En particular, 


x'(0) =3(Pp,—Po) y Y(1) = 3(p3 — p») (9) 


8.6 Curvas y superficies 489 


Geométricamente, p, está sobre la recta tangente a la curva en Po, y p» está sobre la recta 
tangente a la curva en p3. Véase la figura 8. Además, a partir de x”(t), calcule 


Xx (5) = HÁPo — Pi + P2 + P3) (10) 


Sean y(t) la curva de Bézier determinada por Qo,..., 43, y Z(£) la curva de Bézier determinada 
por ro,..., r3. Como y(¢) recorre la misma trayectoria que x(¢), pero solo llega hasta x(.5) 
conforme £ va de O a 1, entonces y(t) = x(.5t) para 0 S t S 1. De manera similar, ya que 
z(t) inicia en x(.5) cuando £ = 0, entonces z(t)= x(.5 + .5t) para O0 5 t S 1. De acuerdo con 
la regla de la cadena para derivadas, 


y (1) =.5xX (51) y z(t)=.5x(.5+.5t) para0sts1 (11) 


A partir de (9) con y'(0) en vez de x'(0), de (11) con £ = 0, y de (9), los puntos de control 
para y(t) satisfacen 


3(qı — qo) = y'(0) = .5x' (0) = (Pp; — Po) (12) 
A partir de (9) con y'(1) en vez de x'(1), de (11) con £ = 1, y de (10), 


3(q3 — 92) = y (1) = .5x'(.5) = Po — Pı + P2 + P3) (13) 


Las ecuaciones (8), (9), (10), (12) y (13) se pueden resolver y así generar las fórmulas para 
qo;.--, q3 que se muestran en el ejercicio 13. Geométricamente, las fórmulas se presentan en 
la figura 9. Los puntos de control interiores qı y r2 son los puntos medios, respectivamente, 
del segmento de po a pı y el segmento de p2 a p3. Cuando el punto medio del segmento de 
pı a p2 se conecta a qı, jel segmento de recta resultante tiene a q2 como punto medio! 


1 
z (P1 + P3) 


Pi A P 
BA TSA 
E 43="Fo SO 















qo = Po P3 =T; 


FIGURA 9 Estructura geométrica de los nuevos puntos de 
control. 


Esto completa un paso del proceso de subdivisión. La “recursión” inicia, y las nuevas curvas 
se subdividen. La recursión continúa a una profundidad en la cual todas las curvas son lo sufi- 
cientemente rectas. De manera alternativa, en cada paso la recursión puede ser “adaptiva” y no 
subdividir una de las dos nuevas curvas si esa curva es suficientemente recta. Una vez que la sub- 
división se detiene por completo, los puntos extremos de cada curva se unen mediante segmentos 
de recta, y la escena está lista para el siguiente paso en la preparación de la imagen final. 

Una superficie bicúbica de Bézier tiene la misma propiedad de variación-disminución 
que las curvas de Bézier que forman cada sección transversal de la superficie, de manera que 
el proceso ya descrito se puede aplicar en cada sección transversal. Omitiendo los detalles, a 
continuación se presenta la estrategia básica. Considere las cuatro curvas de Bézier “parale- 
las” cuyo parámetro es s, y aplique el proceso de subdivisión a cada una de ellas. Esto produce 
cuatro conjuntos de ocho puntos de control; cada conjunto determina una curva conforme s 
varía de O a 1. Sin embargo, al variar t, existen ocho curvas, cada una con cuatro puntos de 
control. Aplique el proceso de subdivisión a cada uno de esos conjuntos de cuatro puntos, 
para crear un total de 64 puntos de control. La recursión adaptiva también es posible en este 
caso, pero hay algunas sutilezas implicadas.? 


2 Véase Foley, Van Dam, Feiner y Hughes, Computer Graphics—Principles and Practice, 2a. ed. (Boston: Addison- 
Wesley, 1996), pp. 527-528. 
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PROBLEMAS DE PRÁCTICA 


El término spline generalmente se refiere a una curva que pasa por puntos especificados. Sin 
embargo, una B-spline, normalmente no pasa a través de sus puntos de control. Un solo seg- 
mento tiene la forma paramétrica 


x(2) = ¿[0 — 0) po + (31 — 61? + 4)p, 


14 
+ (34 + 34 +31 + 1)p, + *p»] y 


para O = £ < 1, donde po, Pi, P2 y p3 son los puntos de control. Cuando tf varía de O a 1, 
x(t) crea un curva corta cercana a p,p»,. Algebra básica indica que la fórmula de B-spline 
también se puede escribir como 


x(t) = 3 [01 — 0) po + (341 — 1)? — 31 + 4)p, 


+ GPA- t) +3t + 1)p, + tp] (15) 


Esto revela la similitud con la curva de Bézier. Excepto por el factor 1/6 al frente, los térmi- 
nos po y p3 son iguales. La componente p; se ha incrementado por —3t + 4, y la componente 
p2 se incrementó por 31 + 1. Esas componentes hacen más cercana la curva a p¡p, que la 
curva de Bézier. El factor 1/6 es necesario para mantener la suma de los coeficientes igual 
a 1. La figura 10 compara una B-spline con una curva de Bézier que tiene los mismos puntos 


de control. 


FIGURA 10 Un segmento B-spline y una curva de Bézier. 


1. Demuestre que la B-spline no inicia en po, pero x(0) está en conv {po, p1, p2}. Suponien- 
do que po, pı y p2 son afínmente independientes, encuentre las coordenadas afines de 
x(0) con respecto a {po, P1, P2}- 

2. Demuestre que la B-spline no termina en p3, pero x(1) está en conv {p1, P2, p3}. Supo- 
niendo que p;, p2 y p3 son afínmente independientes, encuentre las coordenadas afines 
de x(1) con respecto a {P1, P2, P3}- 


8.6 EJERCICIOS 


1. Suponga que una curva de Bézier se traslada a x(1)+ b. Es decir, a) Demuestre que para O = t <= 1, x(f) está en la envolvente 


para O = £ <= 1, la nueva curva es 


x(1) = (1— Po + 31(1— 0p, 
+ 31%(1 —1£)p, + p, +b 


Demuestre que esta nueva curva es una vez más una curva 
de Bézier. [Sugerencia: ¿Dónde están los nuevos puntos de 
control?] 


. La forma vectorial paramétrica de una curva B-spline se definió 
en los problemas de práctica como 


x(t) = [0 — tpo + 3t —1) — 31 + 4)p, 
+6831 — t) + 3t + 1)p, + tp] para0 < t < 1, 


donde po, p1, P2 y p3 son los puntos de control. 


convexa de los puntos de control. 


b) Suponga que una curva B-spline x(1) se traslada a x(1) + b 
(como en el ejercicio 1). Demuestre que esta nueva curva es 
una vez más una B-spline. 


. Sea x(t) una curva de Bézier cúbica determinada por los puntos 


Po; P1, P2 Y P3- 

a) Calcule el vector tangente x'(t). Determine cómo x'(0) y 
x'(1) se relacionan con los puntos de control, y realice des- 
cripciones geométricas de las direcciones de esos vectores 
tangentes. ¿Es posible tener x'(1) = 0? 


b) Calcule la segunda derivada x”(1) y determine cómo x”(0) 
y x"(1) se relacionan con los puntos de control. Dibuje un 


esquema basado en la figura 10 y construya un segmento 
de recta que apunte en la dirección de x”(0). [Sugerencia: 
Utilice pı como el origen del sistema de coordenadas]. 


Sea x(t) la B-spline del ejercicio 2, con puntos de control po, p1, 

p2 y P3. 

a) Calcule el vector tangente x'(t) y determine cómo las deri- 
vadas x'(0) y x'(1) se relacionan con los puntos de control. 
Realice descripciones geométricas de las direcciones de esos 
vectores tangentes. Explore qué pasa cuando x'(0) y x'(1) 
son iguales a 0. Justifique sus afirmaciones. 


b) Calcule la segunda derivada x”(t) y encuentre cómo x”(0) 
y x"(1) se relacionan con los puntos de control. Dibuje un 
esquema basado en la figura 10, y construya un segmento 
de recta que apunte en la dirección de x"(1). [Sugerencia: 
Utilice pz como el origen del sistema de coordenadas]. 


Sean x(1) y y(t) curvas de Bézier cúbicas con puntos de control 
{Po, P1, P2, P3} y [P3, Pa, Ps. Po), respectivamente, de manera 
que x(1) y y(t) se unen en pz. Las siguientes preguntas se refie- 
ren a la curva que consiste en x(1) seguida de y (1). Para simplifi- 
car, suponga que la curva está en R?. 


a) ¿Qué condición sobre los puntos de control garantizará 
que la curva tenga continuidad C! en pz? Justifique su 
respuesta. 


b) ¿Qué ocurre cuando x'(1) y y'(0) son ambos el vector 
cero? 


. Una B-spline se construye mediante segmentos B-spline, des- 


critos en el ejercicio 2. Sean Po,..., p4 puntos de control. Para 
0 =1= 1, sean x(1) y y(1) determinadas por las matrices de geo- 
metría [Po p1 P2 p3] y [P1 P2 Pp3 Pa], respectivamente. Observe 
cómo los dos segmentos comparten tres puntos de control. No 
hay traslape entre los dos segmentos, sin embargo, se unen en 
un punto extremo común, cercano a p2. 


a) Demuestre que la curva combinada tiene continuidad GO, es 
decir, x(1) = y(0). 


b) Demuestre que la curva tiene continuidad C! en el punto de 
unión, x(1). Es decir, demuestre que x'(1) = y'(0). 


Sean x(t) y y(t) las curvas de Bézier del ejercicio 5, y supon- 
ga que la curva combinada tiene continuidad C? (que incluye 
la continuidad C*) en p3. Sea x"(1) = y”(0) y pruebe que ps 
está completamente determinado por pi, p2 y p3. Así, los pun- 
tos Po,..., p3 y la condición C 2 determinan todos, excepto uno, 
los puntos de control para y(t). 


Sean x(t) y y(t) segmentos de una B-spline como en el ejerci- 
cio 6. Demuestre que la curva tiene continuidad C? (como tam- 
bién continuidad C!) en x(1). Es decir, demuestre que x"(1) = 
y"(0). Esta continuidad de alto orden es deseable en aplicacio- 
nes CAD, como en el diseño de carrocerías de automóviles, 
porque las curvas y superficies aparecen mucho más lisas. Sin 
embargo, las B-splines requieren tres veces más cálculos que 
las curvas de Bézier, para curvas de longitud comparable. Para 
superficies, las B-splines necesitan nueve veces el cálculo de 
las superficies de Bézier. Con frecuencia, los programadores 
eligen superficies de Bézier en las aplicaciones (como en los 
simuladores de vuelo) que requieren generación en tiempo 
real. 


10. 
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Una curva de Bézier cuártica se determina mediante cinco pun- 
tos de control, Po, Pi, P2, P3 Y Pa: 


x(t) = (1 —1)p, + 4:(1 —1)'p, + 61(1 —1)”p, 
+4(1—05p,+1%p, fo0<t<1 


Construya la matriz base cuártica Mg para x(1). 


La “B” en B-spline se refiere al hecho de que un segmento x(t) 
se puede escribir en términos de una matriz base, Ms, en una 
forma similar a una curva de Bézier. Es decir, 


x(t = GMsu(t) para0=t=1 


donde G es la matriz de geometría [po pi p2 p3] y u() es 
el vector columna (1, £, 2, £). En una B-spline uniforme, cada 
segmento utiliza la misma matriz base, pero cambia la matriz 
de geometría. Construya la matriz base Mg para x(t). 


En los ejercicios 11 y 12, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


11. 


12. 


a) La curva cúbica de Bézier está basada en cuatro puntos de 
control. 


b) Dada una curva de Bézier cuadrática x(f) con puntos de con- 
trol Po, P1 y p2, el segmento de recta dirigido pı — po (de po 
a pı) es el vector tangente a la curva en po. 


c) Cuando dos curvas de Bézier cuadráticas con puntos de con- 


trol {Po, P1, P2} y [P2, P3, P4) se unen en p», la curva de 
Bézier combinada tendrá continuidad C! en p% si pz es el 
punto medio del segmento de recta entre p1 y p3. 


a 


= 


Las propiedades esenciales de la curvas de Bézier se pre- 
servan bajo la acción de transformaciones lineales, pero no 
traslaciones. 


b) Cuando dos curvas de Bézier x(1) y y(t) se unen en el pun- 
to donde x(1) = y(0), entonces la curva combinada tiene 
continuidad G? en ese punto. 


c) La matriz base de Bézier es una matriz cuyas columnas son 
los puntos de control de la curva. 


Los ejercicios 13 a 15 se refieren a la subdivisión de la curva de 
Bézier que se muestra en la figura 7. Sea x(t) la curva de Bézier, 
con puntos de control po,..., pa, y sean y(t) y z(t) las curvas de 
Bézier de subdivisión como en el libro, con puntos de control 


qo». 
13. 


14. 


-< q3 Y Kros...» r3, respectivamente. 


a) Utilice la ecuación (12) para demostrar que qı es el punto 
medio del segmento de po a pi. 


b) Aplique la ecuación (13) para demostrar que 


8q2 = 8q; + Po + Pi — P2 — P3 


c) Utilice el inciso b), la ecuación (8) y el inciso a) para 
demostrar que q2 es el punto medio del segmento de 
qı al punto medio del segmento de pı a p2. Es decir, 


q = tq + 5(P, + P2)]. 


a) Justifique cada signo de igualdad: 
3(13 — 12) = 7 (1) = .5x (1) = iP P2) 
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15. 


16. 


b) Demuestre que r, es el punto medio del segmento de p» 
a p3. 

c) Justifique cada signo de igualdad: 3(r, — ro) = z'(0) = 
5x'(.5). 

d) Utilice el inciso c) para demostrar que 8r; = —Po — pi + 
P2 + p3 + 8ro. 

e) Use el inciso d), la ecuación (8) y el inciso a) para demostrar 
que rı es el punto medio del segmento de rz al punto medio 
del segmento de p; a p2. Es decir, rı = tir + 1 (pı + p2)]. 


Algunas veces solo se necesita la mitad de una curva de Bézier 
para subdividir más. Por ejemplo, la subdivisión del lado “iz- 
quierdo” se logra con los incisos a) y c) del ejercicio 13 y la 
ecuación (8). Cuando se dividen ambas mitades de la curva x(1), 
es posible organizar los cálculos de manera eficiente para de- 
terminar al mismo tiempo los puntos de control izquierdos y 
derechos, sin emplear la ecuación (8) directamente. 


a) Demuestre que los vectores tangentes y'(1) y z'(0) son 
iguales. 


b) Utilice el inciso a) para demostrar que q3 (que es igual a ro) 
es el punto medio del segmento de q» a ri. 


c) Empleando el inciso b) y los resultados de los ejercicios 13 
y 14, escriba un algoritmo que calcule los puntos de control 
de y(t) y z(t) de manera eficiente. Solo se necesitan sumas y 
división entre 2. 


Explique por qué una curva cúbica de Bézier está determinada 
plenamente por x(0), x'(0), x(1) y x'(1). 


17. 


18. 


La simbología TrueType*, creada por Apple Computer y Ado- 
be Systems, utiliza curvas cuadráticas de Bézier, mientras que 
PostScript%, creado por Microsoft, emplea curvas cúbicas de 
Bézier. Las curvas cúbicas dan más flexibilidad para el diseño 
de los tipos de letra, pero es importante para Microsoft que cada 
letra que utiliza curvas cuadráticas se pueda transformar en una 
que use curvas cúbicas. Suponga que w(+) es una curva cuadrá- 
tica, con puntos de control po, pı y P2- 


a) Encuentre puntos de control ro, r;, r y r3 tales que la curva 
cúbica de Bézier x(1) con esos puntos de control y con la 
propiedad de que x(t) y w(t) tengan los mismos puntos ini- 
cial y terminal, así como los mismos vectores tangentes en 
t = 0y t= 1. (Véase el ejercicio 16). 

b) Demuestre que si x(1) se construye como en el inciso a), en- 
tonces x(1) = w(t) para0=1t=<l. 


Utilice la multiplicación matricial particionada para calcular 
el siguiente producto matricial, que se presenta en la fórmula 
alternativa (5) para una curva de Bézier: 


1 0 0 olm 
-3 3 0 ojpi 


3 —6 3 olip 
-1 3 3 1J|lp, 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. De la ecuación (14) con £ = 0, x(0) + po porque 


x(0) = ¿[po + 4p, + P2] = ¿po + $p; + hp» 


Los coeficientes son no negativos y suman 1, por lo que x(0) está en conv {po, P1, P2}, Y 


las coordenadas afines con respecto a (po, Pi, P2) son ( 2). 


635) 


2. A partir de la ecuación (14) con £ = 1, x(1) + p3 porque 


x(1) = flp, + 4p, +P3] = 3p, + 3D, + ¿P3 


Los coeficientes son no negativos y suman 1, por lo que x(1) está en conv (pi, P2, p3}, y las coor- 


denadas afines con respecto a (pi, p», p3) son ( 2). 


1.4.3) 


TEOREMA 





APÉNDICE 


A, 


Unicidad de la forma escalonada 
reducida 


Unicidad de la forma escalonada reducida 


Cada matriz A de m x n es equivalente por filas a una única matriz escalonada redu- 
cida U. 


DEMOSTRACIÓN La demostración se basa en la idea de la sección 4.3 de que las columnas 
de matrices equivalentes por filas tienen exactamente las mismas relaciones de dependencia 
lineal. 

El algoritmo de reducción por filas indica que al menos existe una matriz U del tipo 
mencionado. Suponga que A es equivalente por filas a las matrices U y V en forma escalonada 
reducida. La entrada del extremo izquierdo, distinta de cero, en una fila de U es un “1 prin- 
cipal”. La ubicación de este 1 principal se conoce como posición pivote, y la columna corres- 
pondiente que lo contiene es una columna pivote. (Esta definición solo emplea la naturaleza 
escalonada de U y V, y no supone la unicidad de la forma escalonada reducida). 

Las columnas pivote de U y V son precisamente las columnas distintas de cero que no 
son linealmente dependientes de las columnas a su izquierda. (Esta condición se satisface 
automáticamente por una primera columna, si esta es distinta de cero). Como U y V son 
equivalentes por filas (ambas son equivalentes por filas a A), sus columnas tienen las mismas 
relaciones de dependencia lineal. Así, las columnas pivote de U y V se presentan en idénti- 
cas ubicaciones. Si existen r de tales columnas, y puesto que U y V están en forma escalonada 
reducida, entonces sus columnas pivote son las primeras r columnas de la matriz identidad de 
m x m. En consecuencia, son iguales las columnas pivote correspondientes de U y V. 

Por último, considere cualquier columna de U que no sea pivote, por ejemplo, la colum- 
na j. Esta columna es cero o una combinación lineal de las columnas pivote a su izquierda 
(porque esas columnas pivote son una base para el espacio generado por las columnas a la 
izquierda de la columna j). Ambos casos se pueden expresar mediante Ux = 0 para alguna 
x cuya j-ésima entrada es 1. Entonces, también Vx = 0, lo que significa que la columna j 
de V es cero o la misma combinación lineal de las columnas pivote de V a su izquierda. 
Como las columnas pivote correspondientes de U y V son iguales, entonces también son 
iguales las columnas j de U y V. Esto es válido para todas las columnas que no son pivote, 
de manera que V = U, lo que prueba la unicidad de U. 


A1 


A2 





APÉNDICE 


B 


Números complejos 


Un número complejo es un número que se escribe en la forma 


z=a+ bi 
donde a y b son números reales, e i es un símbolo formal que satisface la relación i? = —1. 
El número a es la parte real de z, que se denota como Re z, y b es la parte imaginaria de z, 
que se denota como Im z. Dos números complejos se consideran iguales si y solo si sus partes 
real e imaginaria son iguales. Por ejemplo, siz = 5 + (—2)i, entonces Re z = 5 e Im z = —2. 
Para simplificar, se escribe z = 5 — 2i. 

Un número real a se considera como un tipo especial de número complejo, al identifi- 
car a cona + 0i. Además, las operaciones aritméticas de los números reales se pueden exten- 
der al conjunto de números complejos. 

El sistema de números complejos, que se denota con C, es el conjunto de todos los nú- 
meros complejos, junto con las siguientes operaciones de suma y multiplicación: 


(a + bi) + (c + di) = (a+ c)+ (b+ di (1) 
(a + bi)\(c + di) = (ac — bd) + (ad + bc)i (2) 


Esas reglas se reducen a la suma y multiplicación ordinarias de números reales cuando 
b y d son cero en las ecuaciones (1) y (2). Es fácil comprobar que las leyes usuales de la 
aritmética para R también son válidas para C. Por esta razón, la multiplicación por lo general 
se calcula mediante desarrollos algebraicos, como se muestra en el siguiente ejemplo. 


EJEMPLO 1 
(5— 2i)(3 + 4i) = 15 + 20i — 6i — 8i? 
= 15 + 14i — 8(—1) 
= 23 + 14i 
Es decir, multiplique cada término de 5 — 2i por cada término de 3 + 4i, utilice i? = —1, 


y escriba el resultado en la forma a + bi. 
La resta de los números complejos z1 y z2 se define por 
zı — z2 = zı + (—1)z2 


En particular, se escribe —z en vez de (—1)z. 
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El conjugado de z = a + bi es el número complejo Z (que se lee “z barra”), definido 
por 


z=a-= bi 
Para obtener Z de z basta con cambiar el signo de la parte imaginaria. 


EJEMPLO 2 El conjugado de —3 + 4¡es —3 — 4i; escriba —3 + 4i = —3 — 4i. 
Observe que si z = a + bi, entonces, 
zZ = (a + bi)(a — bi) = &? — abi + bai — b’i? = a° + b? (3) 


Como zZ es real y no negativo, entonces tiene una raíz cuadrada real. El valor absoluto 
(o módulo) de z es el número real |z| definido por 


ld =4%x =4a? +1? 


Si z es un número real, entonces z = a + Oi, y |z| = la? , Que es igual al valor absoluto ordi- 
nario de a. 

A continuación se listan algunas propiedades útiles de conjugados y del valor absoluto; 
w y z denotan números complejos. 


Z = z si y solo si z es un número real. 

w+z=W0+Zz. 

wz = WZ, en particular, rZ = rZ si res un número real. 
zZ = |z? > 0. 

|wz| = [wlizl. 

jw + z| < |w] + izl. 


PAR a S 


Si z + 0, entonces |z| > 0 y z tiene un inverso multiplicativo, que se denota como 1/z 
oz”! y está dado por 


AE 
Z |21? 


Desde luego, un cociente w/z simplemente significa w - (1/2). 


EJEMPLO 3 Sean w = 3 + 4i yz = 5 — 2i. Calcule zZ, |z| y w/z. 
SOLUCIÓN A partir de la ecuación (3), 


zZ = 5 + (2? =25+4=29 


Para el valor absoluto, |z| = vVzZ = v29. Para calcular w/z, primero multiplique el nu- 
merador y el denominador por Z, el conjugado del denominador. Utilizando la ecuación (3), 


A4 APÉNDICE B Números complejos 


se elimina la i en el denominador: 





w 3 +41 
Zz 5-2 
3+4i 5+2i 
5-2i 5+2i 
15+ 6i + 20i —8 
52 + (—2)} 
7+ 261 
29 
7 26. 


29 * 29' m 











Interpretación geométrica 


Cada número complejo z = a + bi corresponde a un punto (a, b) en el plano R?, como en 
la figura 1. El eje horizontal es el eje real ya que los puntos (a, 0) en este corresponden 
a los números reales. El eje vertical es el eje imaginario porque los puntos (0, b) sobre 
este corresponden a los números imaginarios puros de la forma 0 + bi, o simplemente bi. 
El conjugado de z es la imagen de espejo de z en el eje real. El valor absoluto de z es la 
distancia de (a, b) al origen. 


Eje 
imaginario 


b+ z=a+bi 


Eje real 





FIGURA 1 El complejo conjugado es una imagen 
de espejo. 


La suma de los números complejos z = a + bi y w = c + di corresponde a la suma 
vectorial de (a, b) y (c, d) en R?, como se muestra en la figura 2. 


W+z 





FIGURA 2 Suma de números complejos. 
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Para dar una representación gráfica de la multiplicación compleja, se utilizan coordena- 
das polares en R?. Dado un número complejo diferente de cero z = a + bi, sea y el ángulo 
entre el eje real positivo y el punto (a, b), como se muestra en la figura 3, donde — 7 <p S 7. 
El ángulo ọ se llama el argumento de z; y se escribe y = arg z. De trigonometría, 


a = |z| cosp, b= |z| sen ọ 
y así, 


z =a + bi = lzl(cos p + i sen p) 


Im z 


121 
Iz| sen Q 


`e Re z 
lzl cos y 


FIGURA 3 Coordenadas polares de z. 


Si w es otro número complejo distinto de cero, por ejemplo, 
w = |w| (cos Y + i sen 9) 


entonces, empleando identidades trigonométricas estándares para el seno y coseno de la suma 
de dos ángulos, es posible comprobar que 


wz = |w] |z| [cos(9 + p) + isen(9 + p)] (4) 


Véase la figura 4. Para cocientes, se puede escribir una fórmula similar en forma polar. 
Las expresiones para productos y cocientes se enuncian como sigue. 


Imz 
wz 
w z 
+E 


y 
p Rez 


FIGURA 4 Multiplicación con coordenadas 
polares. 


El producto de dos números complejos distintos de cero está dado, en forma polar, por 
el producto de sus valores absolutos y la suma de sus argumentos. El cociente de dos 
números complejos distintos de cero está dado por el cociente de sus valores absolu- 
tos y la diferencia de sus argumentos. 


Imz 
iz 
o+5 EJEMPLO 4 
ed a) Si w tiene valor absoluto 1, entonces w = cos Y + i sen Y, donde Y es el argumento 
E de w. La multiplicación de cualquier número z diferente de cero por w simplemente hace 
9 Rez girar a z un ángulo 0. 


b) El argumento de i es m/2 radianes, de manera que la multiplicación de z por i hace girar 
Multiplicación por i. a z un ángulo de 7/2 radianes. Por ejemplo, 3 + i gira (3 + iji = —1 + 3i. E 
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Potencias de un número complejo 


La fórmula (4) se aplica cuando z = w = r(cos p + i sen p). En este caso, 


z? = rYUcos 24 + ¡sen 2p) 


=z z 
= r(cos o + i sen p) : r°(cos 2¢ + i sen 29) 
= r?(cos 3¢ + i sen 3p) 

En general, para cualquier entero positivo k, 


z= rK(cos kọ + i sen kọ) 


Este resultado se conoce como teorema de De Moivre. 


Números complejos y R? 


No obstante que los elementos de R? y C están en correspondencia uno a uno, y las ope- 
raciones de suma son esencialmente las mismas, existe una diferencia lógica entre R? y C. 
En R? solo se puede multiplicar un vector por un escalar real, mientras que en C es posi- 
ble multiplicar dos números complejos cualesquiera para obtener un tercer número comple- 
jo. (El producto punto en R? no cuenta, porque produce un escalar, no un elemento de R?.) 
Se utiliza notación escalar para los elementos de C con la finalidad de poner de relieve esta 
diferencia. 


+ (2,4) + 2+4i 


(1, 2) -1 +21 








(3, 2) 3-2i 








El plano real [R?, El plano complejo C. 


Glosario 


A 


adjunta clásica: La matriz adj A formada de una matriz cuadrada A 
al remplazar la entrada (i, j) de A por el cofactor (i, j), para toda 
i y j, y después transponer la matriz resultante. 


algoritmo de reducción por filas: Un método sistemático que em- 
plea operaciones elementales de fila que reduce una matriz a la 
forma escalonada o a la forma escalonada reducida. 


análisis de tendencia: El uso de polinomios ortogonales para ajustar 
datos, con el producto interior dado por la evaluación en un 
conjunto finito de puntos. 


ángulo (entre vectores diferentes de cero u y v en R? o R3): El ángu- 
lo 9 entre los dos segmentos de recta dirigidos del origen a los 
puntos u y v. Relaciona al producto escalar mediante 


uy = llull ivl] cos Y 


aproximación de Fourier (de orden n): El punto más cercano, en 
el subespacio de polinomios trigonométricos de n-ésimo orden, 
a una función dada en C[0, 271]. 


aritmética de punto flotante: Aritmética con números representa- 
dos como decimales + .d| *** d, x 10", donde r es un entero y 
el número p de dígitos a la derecha del punto decimal general- 
mente está entre 8 y 16. 


atractor (de un sistema dinámico en R?): El origen cuando todas las 
trayectorias tienden a 0. 


B 


base (para un subespacio no trivial H de un espacio vectorial V): 
Un conjunto indexado B = {v1,..., Vp} en V tal que: i. B es un 
conjunto linealmente independiente y ii. El subespacio gene- 
rado por B coincide con H, es decir, H = Gen (v1,..., Vp). 

base de vectores propios: Una base que consiste totalmente en 
vectores propios de una matriz dada. 

base estándar: La base € = [ej,..., e) para R” que consiste en las 
columnas de la matriz identidad de n x n, o la base (1, £,..., 1”) 
para P,,. 

base ortogonal: Una base que también es un conjunto ortogonal. 


base ortonormal: Una base que es un conjunto ortogonal de vec- 
tores unitarios. 


B-coordenadas de x: Véase coordenadas de x respecto de la base 
b. 

B-matriz (para T): Una matriz [T]g para una transformación lineal 
T : V —> V respecto de una base B para V, con la propiedad de 
que [T&)]s = [T]s [x]g para toda x en V. 

bola abierta B(p, 9) en R”: El conjunto (x : lx — pl] < 8} en R”, 
donde $ > 0. 


bola cerrada (en R”): Un conjunto {x : lx — pl| < 8] en R”, donde 
p está en R” y ô > 0. 





C 


cadena de Markov: Una secuencia de vectores de probabilidad xo, 
X1, X2,..., junto con una matriz estocástica P tal que Xz+1 = PXx 
para k =0, 1, 2,... 

cambio de base: Véase matriz de cambio de coordenadas. 


cambio relativo o error relativo (en b): La cantidad ||Abl|/I]bl| 
cuando b se cambia a b + Ab. 


cociente de Rayleigh: R(x) = (xTAx)/(x7x). Una estimación de un 
valor propio de A (por lo general, una matriz simétrica). 


codominio (de una transformación T : R” —> R”): El conjunto R” 
que contiene al rango de T. En general, si T mapea un espa- 
cio vectorial V en un espacio vectorial W, entonces W es el 
codominio de T. 


coeficientes de Fourier: Los pesos empleados para hacer que un 
polinomio trigonométrico sea una aproximación de Fourier 
a una función. 


coeficientes de regresión: Los coeficientes Bo y 61 en la recta de 
mínimos cuadrados y = By + Bix. 


cofactor: Un número C;; = (—1)Y det Aj, llamado el cofactor (i, j) 
de A, donde Aj, es la submatriz formada al eliminar la ¡-ésima 
fila y la ¡-ésima columna de A. 


cofactores: Véase desarrollo por cofactores. 
columna pivote: Una columna que contiene una posición pivote. 


combinación afín: Una combinación lineal de vectores (puntos en 
R”) en la que la suma de los pesos implicados es 1. 


combinación convexa (de puntos v;,..., vz en RR”): Una combinación 
lineal de vectores (puntos) en la que los pesos en la combina- 
ción son positivos y la suma de los pesos es 1. 


combinación lineal: Una suma de múltiplos escalares de vectores. 
Los escalares se llaman pesos. 


combinación positiva (de puntos v;,..., V,, en R”): Una combinación 
lineal c¡v¡ + -** + Cm Vm, donde toda c; = 0. 


complemento de Schur: Una cierta matriz formada a partir de 
los bloques de una matriz particionada de 2 x 2, A = [Ajjl. 
Si Aj, es invertible, su complemento de Schur está dado por 
Az — An A An. Si An es invertible, su complemento de 
Schur está dado por 411 — 4124)! 421. 


complemento ortogonal (de W): El conjunto W+ de todos los 
vectores ortogonales a W. 
u 
componente de y ortogonal a u (para u + 0): El vector y — Y'a. 
u-u 
componentes principales (de los datos en una matriz B de observa- 
ciones): Los vectores propios unitarios de una matriz de covarianza 
muestral S para B, con los vectores propios arreglados de tal 
manera que los valores propios correspondientes de S disminuyan 
en magnitud. Si B es una forma de desviación media, entonces las 
componentes principales son los vectores singulares derechos en 


una descomposición en valores singulares de B”. 
A7 


A8 Glosario 


composición de transformaciones lineales: Un mapeo generado 
al aplicar dos o más transformaciones lineales sucesivas. Si las 
transformaciones son transformaciones matriciales, por ejem- 
plo, multiplicación por la izquierda de B seguida por multipli- 
cación por la izquierda de A, entonces la composición es el 
mapeo x > A(Bx). 

conjunto abierto S en R”: Un conjunto que no contiene a ninguno 
de sus puntos frontera. (De manera equivalente, S es abierto si 
cada punto de S es un punto interior). 


conjunto acotado en R”: Un conjunto que está contenido en una 
bola abierta B(0, ô) para alguna ô > 0. 


conjunto afín (o subconjunto afín): Un conjunto S de puntos 
tales que si p y q están en S, entonces, (1 — £)p + tq e S para 
cada número real t. 


conjunto afínmente dependiente: Un conjunto {v1,..., Vp} en R” 
tal que existen números reales c1,..., Cp, nO todos cero, tales 
que c1 + + + cp = 0y cvi + t CY = O. 

conjunto afínmente independiente: Un conjunto {v1,..., Vp} en 
R” que no tiene dependencia afín. 


conjunto cerrado (en R”): Un conjunto que contiene todos sus 
puntos frontera. 


conjunto compacto (en R”): Un conjunto en R” que es cerrado y 
acotado. 


conjunto convexo: Un conjunto S con la propiedad de que para cada 
p y q en S, el segmento de recta pq está contenido en S. 


conjunto fundamental de soluciones: Una base para el conjunto 
de todas las soluciones de una ecuación diferencial o de una 
ecuación en diferencias lineal homogénea. 


conjunto generado por (v;,..., Vp): El conjunto Gen ([v;,..., Vp). 


conjunto generador (para un subespacio H): Cualquier conjunto 
[v1,..., Vp) en H tal que H = Gen (vj,..., Vp}- 

conjunto generador mínimo (para un subespacio HA): Un conjunto 
B que genera a H y tiene la propiedad de que si uno de los 
elementos de B se elimina de B, entonces el nuevo conjunto 
no genera a H. 


conjunto linealmente independiente máximo (en V): Un conjunto 
linealmente independiente B en V tal que si un vector v, que 
está en V pero no en B, se agrega a B entonces el nuevo conjun- 
to es linealmente dependiente. 

conjunto nivel (o gradiente) de una funcional lineal f sobre R”: 
Un conjunto [f: d] = [x e (R”: f(x) = d} 

conjunto ortogonal: Un conjunto S de vectores tales que u:v = 0 
para cada par distinto u, v en S. 

conjunto ortonormal: Un conjunto ortogonal de vectores unitarios. 

conjunto solución: El conjunto de todas las posibles soluciones 
de un sistema lineal. El conjunto solución es vacío cuando el 
sistema lineal es inconsistente. 

contracción: Un mapeo x +> rx para algún escalar r, con 
0O=r<s1l. 

controlable (par de matrices): Un par de matrices (A, B) donde A es 
de n x n, B tiene n filas, y 


rango[B AB A?B ATIB]=n 


Relacionado con un modelo de espacio de estados de un sis- 
tema de control y la ecuación en diferencias Xz+1 = AXz + Bug 
(k =0, 1,...). 


convergente (secuencia de vectores): Una secuencia (x¿) tal que 
las entradas en x; se pueden hacer tan cercanas como se quiera 
a las entradas de algún vector fijo para toda k suficientemente 
grande. 


coordenadas baricéntricas (de un punto p respecto de un con- 
junto S = ([vj,..., Vx) afínmente independiente): El conjunto 
(único) de pesos Cj,..., Cx tales que p = C¡V¡ + *"* + CpVx y 
c1+ +: + cx = 1. (Algunas veces también se llaman coorde- 
nadas afines de p respecto de S.) 


coordenadas de x respecto de la base B = {b1,..., by}: Los pesos 
C1,..., Cn en la ecuación x = cib; + -** + cpb,.. 


coordenadas homogéneas: En R°, la representación de (x, y, z) 
como (X, Y, Z, H) para cualquier H + 0, donde x = X/H, 
y = Y/H,y z = Z/H. En R?, generalmente se toma H = 1, y las 
coordenadas homogéneas de (x, y) se escriben como (x, y, 1). 


corriente de circuito: La cantidad de corriente eléctrica que fluye 
por un circuito que hace la suma algebraica de las caídas de 
voltaje RZ, alrededor del circuito, sea igual a la suma algebraica 
de las fuentes de voltaje en el circuito. 


covarianza (de variables x; y x;, para i + ¡): La entrada s¡¡ en la matriz 
de covarianza $ para una matriz de observaciones, donde x; y x; 
varían sobre las coordenadas ¡-ésima y j-ésima, respectivamente, 
de los vectores de observaciones. 


cubo: Un objeto sólido tridimensional acotado por seis caras cua- 
dradas, con tres caras que se encuentran en cada vértice. 


curva de Bézier cuadrática: Una curva cuya descripción se 
puede describir en la forma g() = (1 — Dfo() + (1) para 
0=H1< 1, donde fo(r) = (1 — Dpo + tpi y AO = (1 — 
pi + tp2. Los puntos po, pı, p2 son los puntos de control 
para la curva. 


D 


demandas intermedias: Demandas de bienes o servicios que se 
consumirán en el proceso de elaborar otros bienes y servicios 
para los consumidores. Si x es el nivel de producción y C 
es la matriz de consumo, entonces Cx lista las demandas 
intermedias. 


desarrollo columna-fila: La expresión de un producto AB como una 
suma de productos exteriores: col¡(4) fila¡(B)+ +- + col,„(A) 
fila, (B), donde n es el número de columnas de A. 


desarrollo por cofactores: Una fórmula para det A empleando los 
cofactores asociados con una fila o una columna, por ejemplo, 
para la fila 1: 


det A = a11C11 + t + ainCin 


descomposición de vectores propios (de x): Una ecuación, 
X = CiVi + © + CVn, que expresa a x como una combi- 
nación lineal de vectores propios de una matriz. 


descomposición en valores singulares (de una matriz A de m x n): 
A = UZEV”, donde U es una matriz ortogonal de m x m, V es 
una matriz ortogonal de n x n, y 2 es una matriz de m x n con 
entradas no negativas sobre la diagonal principal (arregladas en 
orden decreciente de magnitud) y ceros en las demás entra- 
das. Si rango A = r, entonces 2 tiene exactamente r entradas 
positivas (los valores singulares distintos de cero de A) sobre 
la diagonal. 


descomposición en valores singulares reducida: Una factoriza- 
ción A = UDV”, para una matriz A dem x n, con rango r, donde 
U es dem x r con columnas ortonormales, D es una matriz 
diagonal de r x r con r valores singulares de A distintos de cero 
en su diagonal, y Ves den x r con columnas ortonormales. 


descomposición espectral (de A): Una representación 
A= Auu +. o. + Anun u 


donde (u;,..., u,) es una base ortonormal de vectores propios de 
A, y Aj,..., A, son los valores propios correspondientes de A. 


descomposición ortogonal: La representación de un vector y 
como la suma de dos vectores, uno en un subespacio W 
especificado y el otro en W+. En general, una descomposición 
y =c141 + *** + cpu, donde (u;,..., u,) es una base ortogonal 
para un subespacio que contiene a y. 


descomposición polar (de 4): Una factorización A = PQ, donde 
P es una matriz positiva semidefinida de n x n con el mismo 
rango que A, y O es una matriz ortogonal de n x n. 


descripción explícita (de un subespacio W de R”): Una representa- 
ción paramétrica de W como el conjunto de todas las combi- 
naciones lineales de un conjunto de vectores específicos. 


descripción implícita (de un subespacio W de R”): Un conjunto de 
una o más ecuaciones homogéneas que caracterizan a los pun- 
tos de W. 


desigualdad de Cauchy-Schwarz: 





(u, v)| = ||ul|-|lv|| para toda u, v. 


desigualdad del triángulo: 








u + v|| = ljul] + ||v]| para toda u, v. 


determinante (de una matriz cuadrada A): El número det A defini- 
do inductivamente mediante un desarrollo por cofactores sobre 
la primera fila de A. Además, (—1)” veces el producto de las 
entradas diagonales en cualquier forma escalonada U obtenida 
de A por remplazos de fila y r intercambios de fila (pero no por 
operaciones de escalamiento). 


diagonal por bloques (matriz): Una matriz particionada A = [Aj] 
tal que cada bloque Aj; es una matriz cero para ¿ + j. 


diagonal principal (de una matriz): Las entradas con igual índice 
de fila y columna. 


diferente de cero (matriz o vector): Una matriz (con posiblemente 
solo una fila o columna) que contiene al menos una entrada 
distinta de cero. 


dilatación: Un mapeo x > rx para algún escalar r, con 1 <r. 
dimensión: 
de un conjunto S: La dimensión del plano afín más pequeño 
que contiene a S. 
de un espacio vectorial V: El número de vectores en una base 
para V, que se escribe como dim V. La dimensión del espa- 
cio cero es 0. 
de un plano afín S: La dimensión del subespacio paralelo 
correspondiente. 
de un subespacio S: El número de vectores en una base para S, 
que se escribe como dim S. 


distancia a un subespacio: La distancia de un punto dado (vector) v 
al punto más cercano en el subespacio. 


distancia entre u y v: La longitud del vector u — v, que se denota 
como dist (u, v). 


dominio (de una transformación T): El conjunto de todos los vec- 
tores x para los cuales T(x) está definido. 
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E 


ecuación auxiliar: Una ecuación polinomial en una variable r, 
creada con los coeficientes de una ecuación en diferencias 
homogénea. 


ecuación característica (de A): det(A — AI) = 0. 


ecuación en diferencias (o relación de recurrencia lineal): Una 
ecuación de la forma Xg+1 = AX; (k = 0, 1, 2,...) cuya solu- 
ción es una secuencia de vectores, Xo, X1,... 


ecuación homogénea: Una ecuación de la forma Ax = 0, posible- 
mente escrita como una ecuación vectorial o como un sistema 
de ecuaciones lineales. 


ecuación lineal (en las variables x;,..., xy): Una ecuación que se 
puede escribir en la forma ax; + 427%, + *** + anXn = b, donde 
os coeficientes a;,..., an son números reales o complejos. 
byl fi t 1 1 


ecuación matricial: Una ecuación que implica al menos una matriz; 
por ejemplo, Ax = b. 


ecuación no homogénea: Una ecuación de la forma Ax = b con 
b % 0, posiblemente escrita como una ecuación vectorial o 
como un sistema de ecuaciones lineales. 


ecuación paramétrica de un plano: Una ecuación de la forma 
x = p + su + tv (s, t en R), con u y v linealmente 
independientes. 


ecuación paramétrica de una recta: Una ecuación de la forma 
x=p+ty(tenR). 





ecuación vectorial: Una ecuación que implica una combinación 
lineal de vectores con pesos indeterminados. 


ecuaciones normales: El sistema de ecuaciones que se representa 
por ATAx = ATb, cuya solución conduce a las soluciones de 
mínimos cuadrados de Ax = b. En estadística, una notación 
común es XTXB = X'y. 


ejes principales (de una forma cuadrática x7Ax): Las columnas 
ortonormales de una matriz ortogonal P tal que P7!AP es dia- 
gonal. (Esas columnas son vectores propios unitarios de A.) 
Por lo general, las columnas de P se ordenan de tal manera 
que los valores propios correspondientes de A se acomodan 
en orden decreciente de magnitud. 


eliminación gaussiana: Véase algoritmo de reducción por filas. 


entrada principal: La entrada distinta de cero en el extremo iz- 
quierdo en una fila de una matriz. 


entradas diagonales (en una matriz): Entradas con iguales índices 
de fila y columna. 


envolvente afín (o afín generado) de un conjunto S: El conjunto 
de todas las combinaciones afines de puntos en S, que se denota 
como aff S. 


envolvente convexa (de un conjunto S): El conjunto de todas las 
combinaciones convexas de puntos en S, que se denota como: 
cony S. 


envolvente positiva (de un conjunto S): El conjunto de todas las 
combinaciones positivas de puntos en S, que se denota como 
pos $. 


error cuadrático medio: El error de una aproximación en un espa- 
cio con producto interior, donde el producto interior está dado 
por una integral definida. 


A10 Glosario 


error de mínimos cuadrados: La distancia [lb — AX] de b a AX, 
cuando X es una solución de mínimos cuadrados de Ax = b. 


error por redondeo: Error en la aritmética de punto flotante causa- 
do cuando el resultado de un cálculo se redondea (se trunca) 
al número de dígitos de punto flotante almacenado. Además, 
el error que resulta cuando la representación decimal de un 
número tal como 1/3 se aproxima por medio de un número de 
punto flotante con una cantidad finita de dígitos. 


escalamiento (de un vector): Operación que consiste en multipli- 
car un vector (o una fila o columna de una matriz) por un escalar 
distinto de cero. 


escalar: Un número (real) empleado para multiplicar un vector o 
una matriz. 


espacio columna (de una matriz A de m x n): El conjunto Col A 
de todas las combinaciones lineales de las columnas de A. 
Si A = [a] *** a,], entonces Col A = Gen faj,..., a,). De ma- 
nera equivalente, 


Col A = [y : y = Ax para alguna x en [R”) 


espacio con producto interior: Un espacio vectorial sobre el cual se 
define un producto interior. 


espacio fila (de una matriz A): El conjunto Fil A de todas las 
combinaciones lineales de los vectores formados con las filas 
de A; también se denota como Col A”. 


espacio nulo (de una matriz A de m x n): El conjunto Nul A de 
todas las soluciones de la ecuación homogénea Ax = 0. 
Nul A = [x : x está en R” y Ax = 0). 

espacio propio (de A correspondiente a A): El conjunto de todas las 
soluciones de Ax = Ax, donde A es un valor propio de A. Consiste 
en el vector cero y todos los vectores propios asociados a A. 


espacio vectorial: Un conjunto de objetos, llamados vectores, so- 
bre el cual están definidas dos operaciones, llamadas suma y 
multiplicación por escalares. Deben satisfacerse 10 axiomas. 
Véase la primera definición en la sección 4.1. 


espacio vectorial de dimensión finita: Un espacio vectorial que se 
genera por un conjunto finito de vectores. 


espacio vectorial de dimensión infinita: Un espacio vectorial V 
diferente de cero que no tiene base finita. 


espacios vectoriales isomorfos: Dos espacios vectoriales V y W 
para los cuales existe una transformación lineal T uno a uno 
que mapea V sobre W. 


F 


factorización (de A): Una ecuación que expresa A como un producto 
de dos o más matrices. 


factorización de Cholesky: Una factorización A = RTR, donde R 
es una matriz triangular superior invertible cuyas entradas dia- 
gonales son todas positivas. 


factorización de Schur (de A, para escalares reales): Una factori- 
zación A = URU” de una matriz A de n x n, que tiene n va- 
lor propios reales, donde U es una matriz ortogonal de n x n, y 
R es una matriz triangular superior. 


factorización LU: La representación de una matriz A en la forma 
A = LU donde L es una matriz triangular inferior cuadrada 
con unos sobre la diagonal (una matriz triangular inferior uni- 
taria) y U es una forma escalonada de A. 


factorización LU permutada: La representación de una matriz A 
en la forma A = LU donde L es una matriz cuadrada tal que 
una permutación de sus filas formará una matriz triangular in- 
ferior unitaria, y U es una forma escalonada de A. 


factorización QR: Una factorización de una matriz A de m x n con 
columnas linealmente independientes, A = QR, donde Q es una 
matriz de m x n cuyas columnas forman una base ortonormal 
para Col A, y Res una matriz invertible triangular superior de 
n x n con entradas positivas sobre su diagonal. 


fase progresiva (de reducción por filas): La primera parte del algo- 
ritmo que reduce una matriz a la forma escalonada. 


fase regresiva (de reducción por filas): La última parte del algorit- 
mo que reduce una matriz en forma escalonada a una forma 
escalonada reducida. 


filtro lineal: Una ecuación en diferencias lineal empleada para 
transformar señales discretas en el tiempo. 


flop: Una operación aritmética (+, —, *, /) que se efectúa sobre 
dos números reales de punto flotante. 


forma cuadrática: Una función Q definida para x en R” por 
O(x) = x“Ax, donde A es una matriz simétrica de n x n (llama- 
da la matriz de la forma cuadrática). 


forma cuadrática indefinida: Una forma cuadrática Q tal que Q(x) 
toma valores positivos y negativos. 


forma cuadrática negativa definida: Una forma cuadrática Q tal 
que Q(x) < 0 para toda x + 0. 


forma cuadrática negativa semidefinida: Una forma cuadrática 
Q tal que Q(x) < 0 para toda x. 


forma cuadrática positiva definida: Una forma cuadrática Q tal 
que Q(x) > 0 para toda x + 0. 


forma cuadrática positiva semidefinida: Una forma cuadrática Q 
tal que Q(x) = 0 para toda x. 


forma de desviación media (de un vector): Un vector cuyas entra- 
das suman cero. 


forma de desviación media (de una matriz de observaciones): Una 
matriz cuyos vectores fila están en forma de desviación media. 
Para cada fila, las entradas suman cero. 


forma escalonada (o forma escalonada por filas de una matriz): 
Una matriz escalonada que es equivalente por filas a la matriz 
dada. 


forma escalonada reducida (o forma escalonada reducida por fi- 
las): Una matriz escalonada reducida que es equivalente por 
filas a una matriz dada. 

forma homogénea de (un vector) v en [R”: El punto Y = Mi 
en R"+1, 

funcional lineal (en R”): Una transformación lineal f de R” a R. 


funciones propias (de una ecuación diferencial x'(1) = Ax(£)): Una 
función x(1) = ve", donde v es un vector propio de A, y A es 
el valor propio correspondiente. 


G 


Gen (v1,..., Vp}: El conjunto de todas las combinaciones lineales 
de v1,..., Vp. También, el subespacio generado por V1,..., Vp. 


H 


hiperplano (en [R”): Un plano afín en R” de dimensión n — 1. 
También: un traslado de un subespacio de dimensión n — 1. 


hiperplano de soporte (a un conjunto convexo compacto S en [R”): 
Un hiperplano H = [f: d] tal que H N S + Ø y f(x) = d para 
toda x en S o f(x) = d para toda x en S. 


l 
Im x: El vector en R” formado con las partes imaginarias de las en- 
tradas de un vector x en C”. 


imagen (de un vector x bajo una transformación T): El vector T(x) 
asignado a x por T. 


inversa (de uma matriz A de n x n): Uma matriz A7! de n x n, tal 
que AA! =A7!= J,. 


inversa de Moore-Penrose: Véase seudoinversa. 


inversa por la derecha (de A): Cualquier matriz rectangular C tal 
que AC = 1. 


inversa por la izquierda (de A): Cualquier matriz rectangular C 


tal que CA = 1. 
isomorfismo: Un mapeo lineal uno a uno de un espacio vectorial 
sobre otro. 


L 


ley asociativa de la multiplicación: A(BC) = (AB)C, para toda A, 
B, C. 

leyes de Kirchhoff: 1. (ley de voltaje) La suma algebraica de las 
caídas de voltaje RI en una dirección alrededor de un circuito 
es igual a la suma algebraica de las fuentes de voltaje en la 
misma dirección alrededor del circuito. 2. (ley de corriente) La 
corriente en una rama es la suma algebraica de las corrientes de 
circuito que fluyen por esa rama. 

leyes distributivas: (izquierda) A(B + C)= AB + AC, y (derecha) 
(B + C)A = BA + CA, para toda A, B, C. 

linealmente dependientes (vectores): Un conjunto indexado 
[v1,..., Vp} con la propiedad de que existen pesos Cj,..., Cp, 
no todos cero, tales que c¡V¡ + *** + CV) =0. Es decir, la 
ecuación vectorial c1V1 + C2V2 + *** + CpVp = 0 tiene una so- 
lución no trivial. 


longitud (o norma, de v): El escalar ||vl| = Y/v.v = y (v, v). 


M 


magnitud (de un vector): Véase norma. 
mapeo: Véase transformación. 


mapeo de coordenadas (determinado por una base ordenada B en 
un espacio vectorial V): Un mapeo que a cada x en V le asocia 
su vector coordenado [x]g. 


mapeo sobre: Un mapeo 7 : [R” > R” tal que cada b en R” es la 
imagen de al menos una x en R”. 














mapeo uno a uno: Un mapeo T : R” > R” tal que cada b en R” es 
la imagen de a lo sumo una x en R”. 


matrices conformadas para multiplicación por bloques: Dos 
matrices particionadas A y B tales que el producto por bloques 
AB está definido: la partición columna de A debe ajustar con la 
partición fila de B. 
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matrices equivalentes por filas: Dos matrices para las cuales existe 
una secuencia (finita) de operaciones de fila que transforma una 
matriz en la otra. 


matrices que conmutan: Dos matrices A y B tales que AB = BA. 


matrices semejantes: Matrices A y B tales que P7lAP = B, o bien, 
de manera equivalente, A = PBP”, para alguna matriz inver- 
tible P. 


matriz: Un arreglo rectangular de números. 


matriz aumentada: Una matriz construida mediante una matriz de 
coeficientes para un sistema lineal y una o más columnas a la 
derecha. Cada columna adicional contiene las constantes del 
lado derecho de un sistema con la matriz de coeficientes dada. 


matriz banda: Una matriz cuyas entradas diferentes de cero están 
dentro de una banda a lo largo de la diagonal principal. 


matriz bidiagonal: Una matriz cuyas entradas diferentes de cero 
están sobre la diagonal principal y sobre una diagonal adyacente 
a la diagonal principal. 


matriz casi singular: Una matriz mal condicionada. 


matriz compañera: Una matriz de forma especial cuyo polinomio 
característico es (—1)"p(A) cuando p(A) es un polinomio espe- 
cificado cuyo término principal es A”. 


matriz de cambio de coordenadas (de una base $ a una base C): 
Una matriz ¿ Ls que transforma vectores de B-coordenadas 
a vectores de C-coordenadas: [xle = ¿ ¿E glx]g. Si C es la base 
estándar para R”, entonces algunas veces ¿ E g se escribe 
como Pg. 


matriz de coeficientes: Una matriz cuyas entradas son los coeficien- 
tes de un sistema de ecuaciones lineales. 


matriz de consumo: Una matriz en el modelo de entrada y salida de 
Leontief cuyas columnas son los vectores de consumo unitarios 
para los diversos sectores de una economía. 


matriz de covarianza (o matriz de covarianza muestral): La 
matriz S de p x p definida por S =(N — 1)7!|BB”, donde B, es 
una matriz de observaciones de p x N en forma de desviación 
de la media. 


matriz de diseño: La matriz X en el modelo lineal y = XS + e, 
donde las columnas de X están determinadas de alguna forma 
por los valores observados de ciertas variables independientes. 


matriz de entrada-salida: Véase matriz de consumo. 


matriz de flexibilidad: Una matriz cuya j-ésima columna da las 
deflexiones de una viga elástica en puntos específicos cuando se 
aplica una unidad de fuerza en el j-ésimo punto sobre la viga. 


matriz de Gram (de A): La matriz ATA. 
matriz de m x n: Una matriz con m filas y n columnas. 


matriz de migración: Una matriz que indica el movimiento 
porcentual entre dos lugares diferentes, de un periodo al 
siguiente. 


matriz de observaciones: Una matriz de p x N cuyas columnas 
son vectores de observaciones, cada columna lista p medicio- 
nes realizadas sobre un individuo u objeto en una población 
dada o en un conjunto. 


matriz de proyección (o matriz de proyección ortogonal): Una 
matriz simétrica B tal que B? = B. Un ejemplo sencillo es 
B = vv”, donde v es un vector unitario. 
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matriz de rango completo: Una matriz de m x n cuyo rango es el 
menor de m y n. 


matriz de rigidez: La inversa de una matriz de flexibilidad. La 
j-ésima columna de una matriz de rigidez da las cargas que se 
deben aplicar en puntos específicos sobre la viga elástica para 
producir una deflexión unitaria en el j-ésimo punto sobre la 
viga. 

matriz de transferencia: Una matriz A asociada con un circuito 
eléctrico que tiene terminales de entrada y salida, de tal manera 
que el vector de salida es igual a A por el vector de entrada. 


matriz de Vandermonde: Una matriz V de n x n o su transpuesta, 
cuando V tiene la forma 


2 


n—1 
1 xa x xi 
O a 
V = 
2 n—1 
L Kar Xg e -X | 


matriz diagonal: Una matriz cuadrada cuyas entradas fuera de la 
diagonal principal son cero. 


matriz diagonalizable: Una matriz que se puede escribir en la for- 
ma factorizada PDP”*, donde D es una matriz diagonal y P es 
una matriz invertible. 


matriz diagonalizable ortogonalmente: Una matriz A que admite 
una factorización, A = PDP™!, con P una matriz ortogonal 
(P7! = PT) y D diagonal. 

matriz elemental: Una matriz invertible que resulta al efectuar una 
operación elemental de fila sobre una matriz identidad. 


matriz escalonada (o matriz escalonada por filas): Una matriz 
rectangular que tiene tres propiedades: 1. Todas las filas dis- 
tintas de cero están por arriba de cualquier fila constituida 
únicamente de ceros. 2. Cada entrada principal de una fila está 
en una columna a la derecha de la entrada principal de la fila 
superior. 3. En una columna, todas las entradas debajo de una 
entrada principal valen cero. 


matriz escalonada reducida: Una matriz rectangular en forma 
escalonada que tiene estas propiedades adicionales: la entrada 
principal en cada fila distinta de cero es 1, y cada uno de esos 
1 es la única entrada distinta de cero en su columna respectiva. 


matriz estándar (para una transformación lineal T): La matriz A tal 
que T(x) = Ax para toda x en el dominio de T. 


matriz estocástica: Una matriz cuadrada cuyas columnas son vec- 
tores de probabilidad. 


matriz estocástica regular: Una matriz estocástica P tal que algu- 
na potencia matricial P* solo contiene entradas estrictamente 
positivas. 


matriz identidad (denotada por / o /,): Una matriz cuadrada con 
unos sobre la diagonal y ceros en las demás entradas. 


matriz indefinida: Una matriz simétrica A tal que x”Ax toma valores 
positivos y negativos. 

matriz invertible: Una matriz cuadrada que tiene una inversa. 

matriz mal condicionada: Una matriz cuadrada con un número de 
condición grande (o posiblemente infinito); una matriz que es 


singular o que puede convertirse en singular si alguna de sus 
entradas se modifica ligeramente. 


matriz negativa definida: Una matriz simétrica A tal que x7Ax < 0 
para toda x x= (). 


matriz negativa semidefinida: Una matriz simétrica A tal que 
x/Ax = 0 para toda x. 


matriz no singular: Una matriz invertible. 


matriz ortogonal: Una matriz cuadrada U invertible tal que 
U`! =U". 

matriz para T respecto de las bases $ y C: Una matriz M para 
una transformación lineal T : V —> W con la propiedad de que 
[T&)]ce = M[x]g para todas las x en V, donde $ es una base 
para V, y C es una base para W. Cuando W = V y C = B, 
la matriz M se llama matriz B para T y se denota como [T]g. 


matriz particionada (o matriz por bloques): Una matriz cuyas 
entradas son en sí mismas matrices de tamaños adecuados. 

matriz por bloques: Véase matriz particionada. 

matriz positiva definida: Una matriz simétrica A tal que x7Ax > 0 
para toda x + 0. 

matriz positiva semidefinida: Una matriz simétrica A tal que 
x"Ax = 0 para toda x. 

matriz simétrica: Una matriz A tal que 47 = A. 

matriz singular: Una matriz cuadrada que no tiene inversa. 

matriz triangular: Una matriz A con ceros arriba o debajo de las 
entradas diagonales. 

matriz triangular inferior: Una matriz con ceros arriba de la 
diagonal principal. 

matriz triangular inferior permutada: Una matriz tal que una 
permutación de sus filas formará una matriz triangular inferior. 


matriz triangular inferior unitaria: Una matriz triangular inferior 
cuadrada con unos sobre la diagonal principal. 


matriz triangular superior: Una matriz U (no necesariamente cua- 
drada) con ceros debajo de las entradas diagonales u11, U22,... 


media muestral: El promedio M de un conjunto de vectores, 
X1,..., Xy, dado por M = (1/NAX| + +** + Xy). 

mejor aproximación: El punto más cercano (en un subespacio) a 
un vector dado. 


método de potencias: Un algoritmo para estimar un valor propio 
estrictamente dominante de una matriz cuadrada. 


método de potencias inverso: Un algoritmo para estimar un valor 
propio A de una matriz cuadrada, cuando está disponible una 
buena estimación inicial de A. 


mínimos cuadrados ponderados: Problemas de mínimos cuadrados 
con un producto interior ponderado tal como 


(x,y) = why +++ Wwe, Ya 


misma dirección (como un vector v): Un vector que es un múltiplo 
positivo de v. 


modelo de entrada-salida: Véase modelo de entrada y salida de 
Leontief. 


modelo de intercambio: Véase modelo de intercambio de Leontief. 


modelo de intercambio (o cerrado) de Leontief: Un modelo de una 
economía donde están fijas las entradas y las salidas, y donde se 
busca un conjunto de precios para los productos de los sectores 
de tal forma que el ingreso de cada sector iguale los gastos. 
Esta condición de “equilibrio” se expresa como un sistema de 
ecuaciones lineales, con los precios como las incógnitas. 


modelo de Leontief de entrada y salida (o ecuación de producción 
de Leontief): La ecuación x = Cx + d, donde x es la produc- 
ción, d es la demanda final, y C es la matriz de consumo (o 
entrada-salida). La j-ésima columna de C lista las entradas que 
el sector j consume por unidad de salida. 


modelo lineal (en estadística): Cualquier ecuación de la forma 
y = XB + e, donde X y y son conocidas, y f se elige para 
minimizar la longitud del vector residual, e. 


modelo matricial por etapas: Una ecuación en diferencias Xx+ = 
AXx, donde xç; lista el número de hembras en una población en 
el tiempo k, con las hembras clasificadas por varias etapas de 
desarrollo (juveniles, subadultos y adultos). 


multiplicación matricial por bloques: La multiplicación fila-co- 
lumna de matrices particionadas como si las entradas en bloques 
fueran escalares. 


multiplicación por la derecha (por A): Multiplicación de una matriz 
por la derecha por A. 

multiplicación por la izquierda (por A): Multiplicación por A de 
un vector o una matriz por la izquierda. 


multiplicidad algebraica: La multiplicidad de un valor propio como 
una raíz de la ecuación característica. 


múltiplo escalar de u por c: El vector cu que se obtiene al multipli- 
car cada entrada en u por c. 


N 
norma (o longitud, de v): El escalar ||v|| = yv- v = y (v, v). 


normalización (de un vector v diferente de cero): El proceso de crear 
un vector unitario u que es un múltiplo positivo de v. 


núcleo (de una transformación lineal T : V > W): El conjunto de x 
en V tal que T(x) = 0. 


número de condición (de A): El cociente a,/0,, donde a, es el 
valor singular más grande de A y «a, es el valor singular más 
pequeño. El número de condición es +% cuando g, es cero. 


O 


operaciones elementales de fila: 1. Remplazo de una fila por la 
suma de sí misma y un múltiplo de otra fila. 2. Intercambio de 
dos filas. 3. (Escalamiento) Multiplicación de todas las entradas 
en una fila por una constante distinta de cero. 


optimización restringida: El problema de maximizar una cantidad 
como x”Ax o llAx]| cuando x está sujeta a una o más restriccio- 


nes, tales como x'x = 1ox"y =0. 
origen: El vector cero. 


ortogonal a W: Ortogonal a cada vector en W. 


P 


parte triangular inferior (de A): Una matriz triangular inferior cuyas 
entradas sobre la diagonal principal y abajo de ella coinciden 
con las de A. 


perfil (de un conjunto S en [R”): El conjunto de puntos extremos de S. 
pesos: Los escalares que se emplean en una combinación lineal. 


pivote: Un número distinto de cero que se emplea en una posición 
pivote para crear ceros mediante operaciones de fila o se cambia 
en un 1 principal, el cual, a la vez, se utiliza para crear ceros. 
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plano afín (en R”): Un traslado de un subespacio de R”. 


plano que pasa por u, v y el origen: Un conjunto cuya ecuación 
paramétrica es x = su + tv (s, t en R), con u y v linealmente 
independientes. 


planos afines paralelos: Dos o más planos afines tales que cada uno 
es un traslado de los otros planos afines. 


poliedro: Un polítopo en R°. 





polígono: Un polítopo en R?. 


polinomio característico (de A): det(A — AT) o, en algunos libros, 
det(Al — A). 


polinomio de interpolación: Un polinomio cuya gráfica pasa a tra- 
vés de cada punto en un conjunto de puntos de datos en R. 


polinomio trigonométrico: Una combinación lineal de la función 
constante 1 y funciones seno y coseno, como cos nt y sen nt. 


polítopo: La envolvente convexa de un conjunto finito de puntos en 
R” (un tipo especial de conjunto convexo compacto). 


posición estándar: La posición de la gráfica de una ecuación 
x"Ax = c, cuando A es una matriz diagonal. 


posición pivote: Una posición en una matriz A que corresponde a 
una entrada principal en cada forma escalonada de A. 


precios de equilibrio: Un conjunto de precios para la producción 
total de los diversos sectores en una economía, de tal manera 
que el ingreso de cada sector logre equilibrar sus gastos. 


pregunta de existencia: Pregunta: “¿Existe una solución al sistema?”. 
Es decir, “¿el sistema es consistente?”. Además, “¿existe solu- 
ción de Ax = b para todas las posibles b?”. 


pregunta de unicidad: Pregunta: “¿Si existe una solución de un 
sistema, esa solución es la única?”. 


problema de mínimos cuadrados general: A partir de una matriz 
A de m x n, y un vector b en R”, se encuentra $ en R” tal que 
|b — Aŝĝ]|| = ||b — Axl| para toda x en R”. 


proceso de Gram-Schmidt: Un algoritmo para producir una base 
ortogonal u ortonormal para un subespacio que se genera por 
un conjunto dado de vectores. 


producto Ax: La combinación lineal de las columnas de A emplean- 
do como pesos las entradas correspondientes en x. 


producto cruzado: Un término cx;xj en una forma cuadrática, con 
i +j. 

producto exterior: Un producto matricial uv” donde u y v son 
vectores en R” vistos como matrices de n x 1. (El símbolo de 
transpuesta está sobre el “exterior” de los símbolos u y v). 


producto interior: El escalar uv, generalmente escrito como 
u-v, donde u y v son vectores en R” vistos como matrices de 
n x 1. También se llama el producto punto de u y v. En ge- 
neral, una función sobre un espacio vectorial que asigna a cada 
par de vectores u y v un número (u, v}, sujeto a ciertos axiomas. 
Véase la sección 6.7. 


producto punto: Véase producto interior. 


proyección ortogonal de y sobre u (o sobre la recta que pasa 
por u y por el origen, para u + 0): El vector Y definido por 
aa yeu 
1 quo 

proyección ortogonal de y sobre W: El vector único Y en W tal 
que y — $ es ortogonal a W. Notación: Y = proy y y. 
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punto espiral (de un sistema dinámico en Rô): El origen cuando las 
trayectorias caen en espiral hacia Ó. 


punto extremo (de un conjunto convexo S): Un punto p en S tal que 
p no está en el interior de cualquier segmento de recta contenido 
en S. (Es decir, si x, y están en S, y p está sobre el segmento de 
recta Xy, entonces p = x 0 p = y). 


punto frontera de un conjunto S en R”: Un punto p tal que cada bola 
abierta en R” centrada en p se interseca tanto con $ como con el 
complemento de S. 


punto interior (de un conjunto S en [R”): Un punto p en S tal que 
para alguna ô > 0, la bola abierta B(p, ô) centrada en p está 
contenida en S. 


punto silla (de un sistema dinámico en Rô): El origen cuando al- 
gunas trayectorias son atraídas hacia 0 y otras trayectorias son 
repelidas desde 0. 


R 


rango (de una matriz A): La dimensión del espacio columna de A, 
que se denota como rango A. 


rango (de una transformación lineal T): El conjunto de todos los 
vectores de la forma T(x) para alguna x en el dominio de T. 


Re x: El vector en R” formado de las partes reales de las entradas de 
un vector x en C”. 


recta de mínimos cuadrados: La recta y = o + fB1x que minimiza 
el error de mínimos cuadrados en la ecuación y = XB + e. 


recta que pasa por p paralela a v: El conjunto {p + tv: ten R}. 


red en escalera: Una red eléctrica ensamblada que conecta en serie 
dos o más circuitos eléctricos. 


reflexión de Householder: Una transformación x —> Ox, donde 
O = 1 — 2uu” y u es un vector unitario (uu = 1). 


regla de Cramer: Una fórmula para cada entrada en la solución x 
de la ecuación Ax = b cuando A es una matriz invertible. 


regla del paralelogramo para la adición: Una interpretación geo- 
métrica de la suma de dos vectores u, v como la diagonal del 
paralelogramo determinado por u, v y 0. 


regla fila-columna: La regla para calcular un producto AB en el cual 
la entrada (i, j) de AB es la suma de los productos de las entradas 
correspondientes de la fila i de A y columna j de B. 


regla fila-vector para calcular Ax: Regla para calcular un pro- 
ducto Ax en el cual la i-ésima entrada de Ax es la suma de los 
productos de las entradas correspondientes de la fila į de A y 
del vector x. 


regresión múltiple: Un modelo lineal que implica diversas variables 
independientes y una variable dependiente. 


relación de dependencia afín: Una ecuación de la forma c¡v¡ + 
“== + CpYp = 0, donde los pesos c1,..., Cp no todos son cero y 
c++ +c,=0. 

relación de dependencia lineal: Una ecuación vectorial homo- 
génea donde se especifican todos los pesos y al menos un peso 
es distinto de cero. 


relación de recurrencia: Véase ecuación en diferencias. 


remplazo de filas: Una operación elemental de fila que sustituye 
una fila de una matriz por la suma de la fila y un múltiplo de 
otra fila. 


repulsor (de un sistema dinámico en R?): El origen cuando todas 
las trayectorias excepto la secuencia cero constante tienden a 
alejarse de 0. 


resta vectorial: Se calcula u + (—1)v y se escribe el resultado como 
u—y. 

rotación de Givens: Una transformación lineal de R” a R” em- 
pleada en programas computacionales para crear entradas 
cero en un vector (por lo general, una columna de una 
matriz). 


S 


señal (o señal discreta de tiempo): Una secuencia doblemente in- 
finita de números, (yx); una función definida sobre los enteros; 
pertenece al espacio vectorial S. 


serie de Fourier: Una serie infinita que converge a una función en el 
espacio con producto interior C[O, 271], con el producto interior 
dado por una integral definida. 


seudoinversa (de A): La matriz VD”*U7, cuando UDV7 es una 
descomposición en valores singulares reducida de A. 


simplejo: La envolvente convexa de un conjunto finito de vectores 
en R” afínmente independientes. 


sistema de ecuaciones lineales (o sistema lineal): Una colección de 
una o más ecuaciones lineales que implican el mismo conjunto 
de variables, por ejemplo, xj,..., X. 


sistema desacoplado: Una ecuación en diferencias yz+1 = Ayx, O 
una ecuación diferencial y'(1) = Ay(2), en la cual A es una matriz 
diagonal. La evolución discreta de cada entrada en yz (como una 
función de k), o la evolución continua de cada entrada en la 
función vectorial y(£), no sufren alteración por lo que ocurre con 
las otras entradas conforme k>% 0 1>0, 


sistema dinámico: Véase sistema dinámico lineal discreto. 


sistema dinámico lineal discreto: Una ecuación en diferencias de 
la forma Xx+1 = Axz que describe los cambios en un sistema 
(por lo general, un sistema físico) conforme pasa el tiempo. 
El sistema físico se mide en tiempos discretos, cuando k = 0, 


1, 2,..., y el estado del sistema al tiempo k es un vector Xy 
cuyas entradas indican ciertos hechos de interés sobre el 
sistema. 


sistema lineal: Una colección de una o más ecuaciones lineales que 
implica las mismas variables, por ejemplo, xj,..., X. 


sistema lineal consistente: Un sistema lineal con al menos una 
solución. 


sistema lineal inconsistente: Un sistema lineal que carece de so- 
lución. 

sistema sobredeterminado: Un sistema de ecuaciones con más 
ecuaciones que incógnitas. 


sistema subdeterminado: Un sistema de ecuaciones con menos 
ecuaciones que incógnitas. 


sistemas (lineales) equivalentes: Sistemas lineales con el mismo 
conjunto solución. 


sólido regular: Uno de los cinco posibles poliedros regulares 
en R3: el tetraedro (4 caras triangulares iguales), el cubo (6 
caras cuadradas), el octaedro (8 caras triangulares iguales), 
el dodecaedro (12 caras pentagonales iguales), y el icosaedro 
(20 caras triangulares iguales). 


solución (de un sistema lineal que implica las variables xj,..., Xp): 
Una lista (51, 52,..., Sn) de números que hacen que cada ecuación 
en el sistema sea un enunciado verdadero cuando los valores 
$1,..., Sn Se sustituyen para xj,..., Xy, respectivamente. 


solución de mínimos cuadrados (de Ax = b): Un vector X tal que 
lb — AR] < [lb — Ax] para toda x en R”. 


solución general (de un sistema lineal): Una descripción paramétri- 
ca de un conjunto solución que expresa las variables básicas 
en términos de las variables libres (los parámetros), si las hay. 
Después de la sección 1.5, la descripción paramétrica se escri- 
be en forma vectorial. 


solución no trivial: Una solución distinta de cero de una ecuación 
homogénea o de un sistema de ecuaciones homogéneas. 


solución trivial: La solución x = 0 de una ecuación homogénea 
Ax =0. 


subconjunto propio de un conjunto S: Un subconjunto de S que 
no es igual a S mismo. 


subespacio: Un subconjunto H de algún espacio vectorial V tal 
que H tiene estas propiedades: 1. El vector cero de V está 
en H; 2. H es cerrado bajo suma vectorial; y 3. H es cerrado 
bajo multiplicación por escalares. 


subespacio cero: El subespacio {0} que consta solamente del vector 
cero. 


subespacio invariante (para A): Un subespacio H tal que Ax está 
en H siempre que x se encuentre en H. 


subespacio propio: Cualquier subespacio de un espacio vectorial V 
diferente de V. 


subespacios fundamentales (determinados por A): El espacio nulo y 
el espacio columna de A, y el espacio nulo y el espacio columna 
de A”, con Col A? comúnmente llamado el espacio fila de A. 


submatriz (de A): Cualquier matriz que se obtiene al eliminar algu- 
nas filas y/o columnas de A; también, la propia A. 


suma de columna: La suma de las entradas en una columna de una 
matriz. 


suma de fila: La suma de las entradas en una fila de una matriz. 


suma vectorial: Operación que consiste en sumar vectores mediante 
la adición de las correspondientes entradas. 


sustitución regresiva (con notación matricial): La fase regresiva 
de reducción por filas de una matriz aumentada que transfor- 
ma una matriz escalonada en una matriz escalonada reducida; 
se utiliza para obtener la solución (o soluciones) de un sistema 
de ecuaciones lineales. 


T 


tamaño (de una matriz): Dos números, escritos en la forma m x n, 
que especifican el número de filas (m) y de columnas (n) en la 
matriz. 


tetraedro: Un objeto sólido tridimensional acotado por cuatro caras 
triangulares iguales, con tres caras que se encuentran en cada 
vértice. 


transformación (o función, o mapeo) T de R” a R”: Una regla 
que asigna a cada vector x en R” un único vector T(x) en R”. 
Notación: T : R” —> R”. Además, T : V > W denota una regla 
que asigna a cada x en V un único vector T(x) en W. 


Glosario A15 


transformación afín: Un mapeo T : R” —> R” de la forma T(x) = 
Ax + b, con una matriz A de m x n y b en [R”. 


transformación de semejanza: Una transformación que cambia A 
a la forma P'AP. 


transformación lineal invertible: Una transformación lineal 
T : R” — R” tal que existe una función S : R” —> R” que satis- 
face tanto T(S(x)) = x como S(T(x)) = x para toda x en R”. 


transformación lineal T (de un espacio vectorial V a un espacio 
vectorial W): Una regla T que asigna a cada vector x en V un 
único vector T(x) en W, tal que i. T(u + v) = T(u) + T(v) para 
toda u, v en V, y ii. T(cu) = cT(u) para toda u en V y todos los 
escalares c. Notación: T : V —> W; también, x > Ax cuando 
T : R” —> R” y A es la matriz estándar para T. 


transformación matricial: Un mapeo x > Ax, donde A es una 
matriz de n x n y x representa cualquier vector en R”. 


transpuesta (de A): Una matriz AT de n x m, cuyas columnas son 
las filas correspondientes de la matriz A de m x n. 


traslación (por un vector p): La operación de sumar p a un vector 
o a cada vector en un conjunto dado. 


trayectoria: La gráfica de una solución {Xọ, X1, X2,...} de un sistema 
dinámico X%+ı = AX; los puntos a menudo están conectados 
por una delgada curva, para facilitar la visualización de la 
trayectoria. Además, la gráfica x(t) para t = O, cuando x(1) es 
una solución de una ecuación diferencial x'(1) = Ax(0). 


traza (de una matriz cuadrada A): La suma de las entradas diagonales 
en A; se denota como tr A. 


triangular superior en bloques (matriz): Una matriz particionada 
A = [Aj] tal que cada bloque Aj; es una matriz cero para i > j. 


V 


valor propio (de A): Un escalar A tal que la ecuación Ax = AX tiene 
una solución para algún vector x distinto de cero. 


valor propio complejo: Una raíz no real de la ecuación caracterís- 
tica de una matriz de n x n. 


valor propio estrictamente dominante: Un valor propio A¡ de 
una matriz A con la propiedad de que [A] > |Ay| para todos 
los otros valor propios Az de A. 


valores singulares (de A): Las raíces cuadradas (positivas) de los 
valores propios de ATA, arregladas en orden decreciente de 
magnitud. 


variable básica: Una variable en un sistema lineal que corresponde 
a una columna pivote en la matriz de coeficientes. 


variable libre: Cualquier variable en un sistema lineal que no es una 
variable básica. 


variables no correlacionadas: Cualesquiera dos variables x; y xj 
(con i # j) que incluyen las i-ésima y j-ésima coordenadas de 
los vectores de observación en una matriz de observación, de tal 
forma que la covarianza s; es cero. 


varianza (de una variable x;): La entrada diagonal s;; en la matriz de 
covarianza S para una matriz de observaciones, donde x; varía 
sobre la j-ésima coordenada de los vectores de observaciones. 


varianza total: La traza de la matriz de covarianza S de una matriz 
de observaciones. 


vector: Una lista de números; una matriz con una sola columna. En 
general, cualquier elemento de un espacio vectorial. 
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vector cero: El vector único, que se denota por 0, tal queu+0=u 
para toda u. En [R”, 0 es el vector cuyas entradas son todas 
iguales a cero. 


vector columna: Una matriz con una sola columna, o una sola 
columna de una matriz que tiene varias columnas. 


vector coordenado de x respecto de B: El vector [x]g cuyas entra- 
das son las coordenadas de x respecto de la base B. 


vector de consumo unitario: Un vector columna en el modelo de 
entrada y salida de Leontief, que lista las entradas que un sector 
necesita por cada unidad de su salida; una columna de la matriz 
de consumo. 


vector de demanda final (o cuenta de demandas finales): El vec- 
tor d en el modelo de entrada y salida de Leontief que lista los 
valores en dólares de los bienes y servicios requeridos por va- 
rios sectores de la parte no productiva de la economía. El vector 
d puede representar la demanda de los consumidores, consumo 
gubernamental, excedente de producción, exportaciones, u otras 
demandas externas. 


vector de equilibrio: Véase vector de estado estable. 


vector de estado: Un vector de probabilidad. En general, un vector 
que describe el “estado” de un sistema físico, frecuentemente en 
conexión con una ecuación en diferencias Xx+1 = AXz. 


vector de estado estable (para una matriz estocástica P): Un vector 
de probabilidad q tal que Pq = q. 
vector de observaciones: El vector y en el modelo lineal y = 


XP + e, donde las entradas en y son los valores observados 
de una variable dependiente. 


vector de parámetros: El vector incógnita £ en el modelo lineal 
y=XB+ e. 


vector de probabilidad: Un vector en R” cuyas entradas son no 
negativas y suman uno. 


vector de producción: El vector en el modelo entrada y salida de 
Leontief que lista las cantidades que producirán los diversos 
sectores de una economía. 


vector fila: Una matriz con una sola fila, o bien, una fila de una 
matriz que tiene varias filas. 


vector normal (a un subespacio V de R”): Un vector n en R” tal 
que n:x = 0 para toda x en V. 


vector propio (de A): Un vector x distinto de cero tal que Ax = Àx 
para algún escalar À. 


vector propio complejo: Un vector distinto de cero x en C” tal 
que Ax = Ax, donde A es una matriz de n x n, y À es un valor 
propio complejo. 

vector residual: La cantidad e que aparece en el modelo lineal 
general: y = XB + «e; es decir, € = y — XP, la diferencia entre 
los valores observados y los valores predichos (de y). 


vector unitario: Un vector v tal que ||v|| = 1. 


vectores iguales: Vectores en R” cuyas entradas correspondientes 
son las mismas. 


vectores linealmente independientes: Un conjunto indexado 
[vi..., Y») con la propiedad de que la ecuación vectorial 
CiV1 + C2V2 +“ + CpVp = 0 solamente tiene la solución 
trivial, c1 = + = cp = 0. 


vectores singulares derechos (de A): Las columnas de V en la 
descomposición de valores singulares A = UXV”. 


vectores singulares izquierdos (de A): Las columnas de U en 
la descomposición en valores singulares de A = UXV?. 





Respuestas a los ejercicios 
con numeración impar 


Capítulo 1 
Sección 1.1, página 10 

1. La solución es (x1, x2) = (—8, 3), o simplemente, (—8, 3). 
3. (2,1) 


5. Remplazar la Fila 2 por su suma con —4 por la Fila 3, y 
después sustituya la Fila 1 por su suma con 3 por la Fila 3. 


7. El conjunto solución es vacío. 


9. (16,21, 14, 4) 11. Inconsistente 


13. (5,3, -—1) 15. Inconsistente 


17. Los cálculos indican que el sistema es inconsistente, de manera 
que las tres rectas no tienen punto en común. 


19. 142 21. Para toda h. 


23. Sugerencia: Marque un enunciado como verdadero solamente 
si siempre es verdadero. Dar aquí las respuestas sería frustrar la 
finalidad de las preguntas falso-verdadero, las cuales pretenden 
ayudarle a leer con cuidado el libro. 


25. k-2g+h=0 
27. La reducción por filas de 


l: b A k b A 
c d g| ê [0 dono. 05 


indica que d — b(£) debe ser diferente de cero, ya que f y g 
son arbitrarias. De otra forma, para algunas elecciones de f y g 
la segunda fila podría corresponder a una ecuación de la forma 
0 = q, donde q es diferente de cero. Por lo tanto, ad + bc. 


29. Intercambie las Filas 1 y 3; intercambie las Filas 1 y 3. 


31. Remplace la Fila 3 por la Fila 3 + (—4)Fila 1; remplace la 
Fila 3 por la Fila 3 + (4)Fila 1. 


33. Sugerencia: Revise el problema de práctica 1 y después 
escriba una solución. 


Sección 1.2, página 21 


1. Forma escalonada reducida: a y b. Forma escalonada: d. 
No está en forma escalonada: c. 


un 


11. 


13. 


15. 


17. 


19. 


21. 


23. 


Columnas pivote 1 y 3: | 2 4 6 8 


oah do ahde al 


xı = —5 — 3x2 xı = 3 + 2x3 
xo es libre. 9. 3x2=3+2x3 
x=3 x3 es libre. 


X1 = 2x2 = tx 
xX es libre. 
E es libre. 

Xx] = 5+ 3x5 
X2 = 1 + 4x5 
x3 es libre. 

X4 = 4— 9x5 
x5 es libre. 


a) Consistente, con muchas soluciones. 


b) Consistente, con muchas soluciones. 
Para toda h. 


a) Inconsistente cuando h = 2 y k 4 8. 
b) Solución única cuando h + 2. 


c) Muchas soluciones cuando h = 2 y k = 8. 


Sugerencia: Lea el texto con cuidado y escriba las respuestas. 
Recuerde, un enunciado es verdadero solo si es cierto en 
todos los casos. 


Como hay cuatro pivotes (uno en cada columna de la matriz 
de coeficientes), la matriz aumentada se debe reducir a la 
forma 


1 0.0 0 a 
0 1 0 0 b 
0 0 1 0 c 
0 0.0 1 d 
y así, 
X1 a 
X2 =b 
X3 = c 
X4 = d 


A17 
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25. 


27. 


29. 


31. 


Sin importar los valores de a, b, c y d, la solución existe y 
es única. 


Si la matriz de coeficientes tiene una posición pivote en cada 
fila, entonces existe una posición pivote en la fila inferior, y 
no hay lugar para un pivote en la columna aumentada. Así, de 
acuerdo con el teorema 2, el sistema es consistente. 


Si un sistema lineal es consistente, entonces la solución es 
única si y solo si cada columna de la matriz de coeficientes 
es una columna pivote; de lo contrario, existe una infinidad 
de soluciones. 


Un sistema subdeterminado siempre tiene más variables que 
ecuaciones. No pueden existir más variables básicas que ecua- 
ciones, así que al menos una variable es libre. A tal variable 
se le puede asignar una infinidad de valores distintos. Si el 
sistema es consistente, entonces cada valor diferente de una 
variable libre producirá una solución distinta. 


Sí, un sistema de ecuaciones lineales con más ecuaciones que 
incógnitas puede ser consistente. El siguiente sistema tiene 
una solución (x1 = x2 = 1): 


xı + x=2 
Xxx =0 
3x1 +2x2=5 


33. p(1)=1+31 +21? 


Sección 1.3, página 32 


1. 


A 





X, 
R u-2v 
u-v 
u -2v 
u+v 
=y 
Xi 
y 
3 5 2 
X1 —2 + Xx 0 = —3 , 
8 —9 8 
3x1 5x2 2 
2x1 | + 0 =| 3], 
8x1 —9x2 8 
3x1 + 5x2 2 
—2X1 = —3 
8x1 = 9x2 8 
3x1 + 5x2 = 2 
—2x1 = -3 


8x1 = 9x> = 8 


En general, no se muestran los pasos intermedios. 





a = u — 2v, b = 2u — 2y, ¢ = 2u — 3.5v, d = 3u — 4v 
Sí, cada vector en R? es una combinación lineal de u y v. 


11. 
13. 
15. 
17. 


19. 


21. 


23. 


25. 


27. 


29. 


31. 


33. 


0 1 5 0 
X1 4l+x|6|+x3| —-1 =|0 
-1 3 —8 0 


No, b no es una combinación lineal de a;, a, y az. 
No, b no es una combinación lineal de las columnas de A. 
h=3. 


Desde luego, son aceptables los pesos que no son enteros, pero 
algunas elecciones sencillas son 0 : v¡ + 0 : v2 = 0, y 


3 -4 
lv, +0-v)= 1 , 0-vi+1-v= 0 

2 1 

-1 7 
lv +l.v= 1 į l.v-—1l-v= 


3 


Gen (vi, v2) es el conjunto de puntos sobre la recta que pasa 
por vı y 0, ya que v2 es un múltiplo de vi. 


2 


h ; 
i sk | es consistente 


Sugerencia: Demuestre que | 


para toda h y k. Explique qué indica este cálculo acerca 
de Gen {u, v}. 


Sugerencia: Lea con cuidado toda la sección. Ponga especial 
atención a las definiciones y los enunciados de teoremas, 

y también a cualquier observación que aparezca antes 

o después de ellos. 


a) No, tres. b) Sí, un número infinito 


c)aj=1:a+0:a+0-a; 

a) 5v, es la salida de 5 días de operación de la mina +1. 

b) La salida total es x¡v¡ + x2v, así que x¡ y x2 deberían 
240 | 

2824 | 

c) [M] 1.73 días para la mina #1 y 4.70 días para la mina #2. 


(17/14, -34/14, 16/14) = (17/14, -17/7, 8/7) 


a) | Ed 


b) Sume 3.5 g en (0, 1), sume 0.5 g en (8, 1), y sume 2 g en 
Q, 4). 


satisfacer XV] + X2V2 = | 


Sugerencia: Revise el problema de práctica 1 y después escriba 
una solución. 
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1. 


El producto no está definido porque el número de columnas 
(2) en la matriz de 3 x 2 no concuerda con el número de 
entradas (3) en el vector. 


lA 1 2 
a) Ax = | —3 1 | s=- —3 |+3-| 1 
1 6 1 6 

= 6|+| 3 |= 9 

—2 18 16 


un 


x 


11. 


13. 
15. 


17. 


19. 


21. 


23. 


25. 
27. 


1 2 z 1- (—2) + 2- (3) 
b) Ax=| -3 1 ps (23) - (22) + 1-65) 
1 6 1- (—2) + 6- (3) 
4 
=| 9 
16 


Presente su trabajo hasta aquí y también para los ejercicios 
4 a 6, pero de aquí en adelante efectúe los cálculos 
mentalmente. 


OO 


es lia 6 
-1 3 -8 ~ _| -8 
7-5 0 210 
a 1 2pe* z7 
5 1 -3 8 
29] +8[>]+=[%]=[o]> 
e ES 
0 2 4 2| =o 
X3 
1. 3-4 -2 xı —11 
1 5 2 4|x=|x|= 3 
-3 -7 6 12 x3 0 


Sí. (Justifique su respuesta). 


La ecuación Ax = b no es consistente cuando 3b; + bz es 
diferente de cero. (Muestre su trabajo). El conjunto de vectores 
b para los cuales la ecuación es consistente es una recta que 
pasa por el origen [el conjunto de todos los puntos (b1, b2) 

que satisfacen b2 = —3b1]. 


Solo tres filas contienen una posición pivote. De acuerdo con 
el teorema 4, la ecuación Ax = b no tiene una solución para 
cada b en R4. 


El trabajo del ejercicio 17 indica que el enunciado d) en el 
teorema 4 es falso. De manera que los cuatro enunciados 

del teorema 4 son falsos. Por lo tanto, no todos los vectores 
en R* se pueden escribir como una combinación lineal de las 
columnas de A. Además, las columnas de A no generan a RR. 





La matriz [vi v2 v3] no tiene un pivote en cada fila, de 
manera que, de acuerdo con el teorema 4, las columnas de la 
matriz no generan a R4. Es decir, {V1, V2, V3} no genera a RA, 











Sugerencia: Lea el texto con cuidado y marque cada enunciado 
como verdadero o falso. Varias partes de los ejercicios 29 y 30 
son implicaciones de la forma 


“Si (enunciado 1), entonces, (enunciado 2)” 

o, de manera equivalente, 

“(enunciado 2), si (enunciado 1)”. 

Marque tal implicación como verdadera si el «enunciado 
2» es válido en todos los casos cuando el «enunciado 1» es 
verdadero. 


C = —3, c2 = =1, c3 = 2. 


La ecuación matricial se puede escribir como 
C1V1 + C2V2 + C3V3 + C4V4 + C5V5 = V6, donde c¡ = —3, 


29. 


33. 


35. 


37. 
39. 
41. 


Respuestas a los ejercicios con numeración impar A19 


(2 = 1,03 =2, (4 = —1, c5 = 2, y 


+) E 
SERA 


Sugerencia: Inicie con cualquier matriz B de 3 x 3 en forma 
escalonada que tenga tres posiciones pivote. 


Sugerencia: Pregúntese cuántas posiciones pivote tiene A y 
por qué. 


Suponga que y y z satisfacen Ay = z. Entonces, 5z = 5Ay. 

De acuerdo con el teorema 5(b), SAy = A(Sy). Así, 5z = A(Sy), 
lo que muestra que 5y es una solución de Ax = 5z. Por lo 
tanto, la ecuación Ax = 5z es consistente. 


[M] Las columnas no generan a RA 
[M] Las columnas generan a R4. 


[M] Elimine la columna 4 de la matriz del ejercicio 39. 
También es posible eliminar la columna 3 en vez de la 
columna 4. 


Sección 1.5, página 47 


1. 


11. 


El sistema tiene una solución no trivial porque existe una 
variable libre, x3. 


El sistema tiene una solución no trivial porque hay una 
variable libre, x3. 


X1 —1 
<Xx=|x |=x3|-l 
X3 1 
X1 —9 8 
— X2 z 4 $ =5 
x= X3 = X3 1 X4 0 
X4 0 1 
2 
. X=X2| 1 
0 
Sugerencia: El sistema obtenido a partir de la forma 


escalonada reducida es 
X= 4x2 + 5x6 =0 
X3 — X6 = 0 
N5 4x6 =0 
0=0 
Las variables básicas son x1, x3 y x5. Las restantes variables 
son libres. 


5 4 
x= | —2 | +x| —7 | = p + x3q. Geométricamente, 
0 1 
5 
el conjunto solución es la recta que pasa por | —2 | paralela 
4 0 
a| —7 
1 
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—5 
15. Sean u = 1 
0 


—2 
O |. La solución de la 


3 
vV=|0|,p= 
1 0 


ecuación homogénea es x = x3u + x3v, el plano que pasa por 35. 


el origen generado por u y v. El conjunto solución del sistema 
no homogéneo es x = p + x2u + x3v, el plano que pasa por p 
paralelo al conjunto solución de la ecuación homogénea. 


X1 8 —-1 
VW x=|x|=|-4|+2x3| —1 
X3 0 1 


8 
—4 |, paralela a la recta que es el conjunto 
0 


. El conjunto solución es la 


recta que pasa por 


solución del sistema homogéneo del ejercicio 5. 


39. 


19. x = a + tb, donde t representa un parámetro, o 
Z = = —2 -5t 
E x| 2 +e 5 5 X1 
X2 0 3 X, = 3t 
21 = p+ t(q- p) = a +1 l 
. X= P q p == =3 4 


25. a) Aw = A(P + Vn) = Ap + Av, =b+0 =b 





27. (Argumento geométrico con base en el teorema 6) Como la 
ecuación Ax = b es consistente, entonces, de acuerdo con 

el teorema 6, su conjunto solución se obtiene trasladando el 
conjunto solución de Ax = 0. Así, el conjunto solución de 
Ax = b es un solo vector si y solo si el conjunto solución 

de Ax = 0 es un solo vector, y eso ocurre si y solo si Ax = 0 


solamente tiene la solución trivial. 3 


(Demostración con variables libres) Si Ax = b tiene una 
solución, entonces la solución es única si y solo si no hay 
variables libres en el sistema de ecuaciones correspondiente, 
es decir, si y solo si toda columna de A es una columna pivote. 
Esto ocurre si y solo si la ecuación Ax = O tiene solamente la 
solución trivial. 
29. a) Cuando A es una matriz de 4 x 4 con tres posiciones pivote, 
la ecuación Ax = 0 tiene una variable libre y, por lo tanto, 
tiene soluciones no triviales. 


b) Con tres posiciones pivote, A no tiene una posición pivote 
en cada una de sus cuatro filas. Según el teorema 4 de la 
sección 1.4, la ecuación Ax = b no tiene una solución 
para cada posible b. La palabra “posible” en el ejercicio 
significa que los únicos vectores considerados en este caso 
son los que están en R?, esto porque A tiene cuatro filas. 

31. a) Cuando A es una matriz de 3 x 2 con dos posiciones pivotes, 
cada columna es una columna pivote. Así, la ecuación 

Ax = 0 no tiene variables libres y, por consiguiente, 

no tiene solución no trivial. 


b) Con dos posiciones pivote y tres renglones, A no puede 
tener un pivote en cada renglón. Así, de acuerdo con 
el teorema 4 de la sección 1.4, la ecuación Ax = b no 
puede tener una solución para cada posible b (en R3). 


33. 


37. 


5. 


Su ejemplo debería tener la propiedad de que la suma de las 
entradas en cada fila es cero. ¿Por qué? 


Una respuesta: x = | E | 


1 —4 


Una respuesta es A = | 1-4 


| Si b es cualquier vector 


que no es múltiplo de la primera columna de A, entonces el 
conjunto solución de Ax = b es vacío y, por lo tanto, no se 
puede formar al trasladar el conjunto solución de Ax = 0. 
Esto no contradice el teorema 6 porque este último se aplica 
cuando la ecuación Ax = b tiene un conjunto solución que 
no es vacío. 


Suponga que Av = 0 y Aw = 0. Entonces, como 

A(v + w) = Av + Aw, de acuerdo con el teorema 5(a) 
de la sección 1.4, A(v + w) =4Av+4Aw=0+0=0. 
Ahora, sean c y d escalares. Utilizando ambas partes del 
teorema 5, A(cv + dw) = Al(cv) + A(dw) = cAv + 
dAw = c0 + d0 = 0. 


Sección 1.6, página 54 
b) Avn = A(w — p) = Aw — Ap =b-b = 0 1. 


La solución general es pg = 0.875ps, con ps libre. 

Una solución de equilibrio es ps = 1000 y pg = 875. 
Empleando fracciones, la solución general se podría escribir 
como pg = (7/8)ps, y una elección natural de precios 

podría ser pg = 80 y pg = 70. Solo la razón de precios es 
importante. El equilibrio económico no se altera por el cambio 
proporcional en los precios. 


. a) 


Distribución de la 
producción de: 
CyE Man. Serv. 


Salida ' | | Entrada Comprados por: 
.1 .1 2 CyE 
8 .1 4 — Man. 
1 8 4 Serv. 


— 


=> 


9 1 -2 0 
b) | —.8 9 —4 0 
=F =g 6 0 


c) [M] pcye ~ 30, pm = 71, ps = 100. 


a) 
Distribución de la producción de: 
Agr. Man. Serv. Transp. 


Salida + Y y r 


Entrada Comprados por: 


.20 .35 .10 .20 — Agr. 
20 .10 .20  .30 —> Man. 
30 .35 .50  .20 — Serv. 
30 .20 .20  .30 => Transp. 


b) Una solución es pa = 7.99, pu = 8.36, ps = 14.65, 
y pr = 10.00. 


c) Distribución de la producción de: 
Agr. Man. Serv. Transp. 


Salida Y | l Y Entrada Comprados por: 


20 .35 .10  .20 —> Agr. 
.10 .10 .20  .30 — Man. 
40 .35 .50  .20 — Serv. 
30 .20 .20  .30 — Transp. 


d) Una solución es pa = 7.81, pu = 7.67, ps = 15.62, 
y pr = 10.00. 


La campaña ha beneficiado sobre todo al sector de servicios. 


3NaHCO; + H3C¿H50,7 =% Na;C6H;0; + 3H,0 + 3C0, 


9. B2S3 + 6H20 => 2H;BO;3 + 3H>2S 


11. 


13. 


15. 


[M] 16MnS + 13As,Cr¡0035 + 374H,80,4 
> 16HMnNoO, + 26AsH;3 + 130Cr5301, + 327H,0 


xı = x3 — 40 
x2 = X3 + 10 x: = 50 
x3 = 40 
X4 = 50 


x5; = 60 


x3 es libre 

a. b. 
X4 = X6 + 50 
X5 = X6 + 60 


x6 es libre 


xı = 60 + x6 
x2 = —10 + x6 
x3 = 90 + x6 
Xa = X6 

xs =80+ x6 


x6 es libre 


Para que el flujo sea no negativo, x6 = 10. 


Sección 1.7, pág. 60 
Justifique sus respuestas a los ejercicios 1 a 22. 


1. 
5. 
9. 
11. 
15. 
17. 
19. 


23. 


25. 


27. 


Linealmente independientes. 
Linealmente independiente. 7. Linealmente dependiente. 
a) Ninguna h. b) Para toda h. 
h= —4. 13. Para toda h. 
Linealmente dependientes 
Linealmente dependientes 


Linealmente independientes 
. osx Oo m o 0 
o 0fľjo 0fpjOo 0 


0 
0 
Yo 
0 


ocooom 
OSonmn 
OOO 


Las cuatro columnas de la matriz A de 6 x 4 deben ser 
columnas pivote. De lo contrario, la ecuación Ax = 0 tendría 
una variable libre; en tal caso, las columnas de A serían 
linealmente dependientes. 


3. Linealmente dependientes. 


Respuestas a los ejercicios con numeración impar A21 


29. A: Cualquier matriz de 3 x 2 cuya segunda columna es un 
múltiplo de la primera tendrá la propiedad deseada. 
B: Funcionará cualquier matriz de 3 x 2 con dos columnas 
diferentes de cero tales que ninguna de ellas sea múltiplo 
de la otra. En este caso, las columnas forman un conjunto 
linealmente independiente, y así la ecuación Bx = 0 solo 
tiene la solución trivial. 


31. x 


33. Verdadero, según el teorema 7. 
35. Verdadero, de acuerdo con el teorema 9. 


37. Verdadero. Una relación de dependencia lineal entre v1, V2 y V3 
se puede ampliar a una relación de dependencia lineal entre 
V1, V2, V3 y V4 colocando un peso cero en v4. 


41. [M] Utilice las columnas pivote de A, 


3 —4 | 
-5 -3 —11 
BÆN an g 2 
8 -7 4 


Otras elecciones son posibles. 


43. [M] Cada columna de A que no es columna de B está en el 
conjunto generado por las columnas de B. 


Sección 1.8, página 68 
2 2a 
e [2,(2 2.0.0 


, no es única 7. 


— 


, Solución única 


4 
9. x=Xx3 : 
0 


11. Sí, porque el sistema representado por [A b] es consistente. 


13. X2 


X1 


Tu) 
T(w) 


Reflexión a través del origen. 
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15. Xx 





/ T(v) 


Reflexión a través de la recta xı = x2. 


8 3 5 13 2x1 — X2 
CE 
21. Sugerencia: Lea el texto con cuidado y escriba sus 


respuestas. Observe que el ejercicio 21e) es una oración 
de la forma 


“(enunciado 1) si y solo si (enunciado 2)”. 


Marque dicha oración como verdadera si el (enunciado 1) 
es válido siempre que el (enunciado 2) también lo sea y el 
(enunciado 2) es verdadero siempre que el (enunciado 1) 
sea verdadero. 


23. a) Cuando b =0, f(x) = mx. En este caso, para toda x, y en R 
y todos los escalares c y d, 


flex + dy) =mílcx + dy) = mcx + mdy 
= c(mx) + d(my) 
=c-f(0)+d-f0) 


Esto demuestra que f es lineal. 


b) Cuando f(x) = mx + b, con b distinto de cero, 
FO =m0)+b=b%0. 


c) En cálculo, fes una “función lineal” porque la gráfica de f 
es una recta. 


25. Sugerencia: Demuestre que la imagen de una recta (es decir, 
el conjunto de imágenes de todos los puntos sobre una recta) 
se puede representar por la ecuación paramétrica de una 
recta. 


27. Cualquier punto x sobre el plano P satisface la ecuación 
paramétrica x = su + tv para algunos valores de s y t. 
Por linealidad, la imagen T(x) satisface la ecuación 
paramétrica 


T(x) = sT(u) + tT(v) (s,ten R) E) 


El conjunto de imágenes es justamente Gen {T(u), T(v)}. 
Si T(u) y T(v) son linealmente independientes, 

Gen (T(u), 7(v)) es un plano a través de T(u), T(v), y 0. 
Si T(u) y T(v) son linealmente dependientes y no son 
nulos a la vez, entonces Gen (T7(u), T(v)] es una recta 
que pasa por 0. Si T(u) = T(v) = 0, entonces 

Gen {T(u),T(v)} es {0}. 


29. Xz 
T(u+v)% TU)| u u+v 
T(v) v 
E AN xı 
%2 


No Ha 


T(u) u 
— 


31. Sugerencia: Como {vV1, V2, V3} es linealmente dependiente, 
se puede escribir cierta ecuación y trabajar con ella. 





33. Una posibilidad es demostrar que T no mapea el vector cero 
en el vector cero, algo que sí hace toda transformación lineal: 
T(0, 0) = (0, —3, 0). 


35. Tome u y v en R? y sean c y d escalares. Entonces, 
cu + dv = (cu; + dvi, cuz + dvz, cuz + dv3) 
La transformación T es lineal porque 


T(cu + dv) = (cu, + dv,,0, cuz + duz) 
= (cu,,0, cuz) + (du;,, 0, duz) 
= c(u,,0,u3) + d(v;, 0, uz) 
=CT(u) + dT(v) 


37. [MJ] Todos los múltiplos de (—1, —1, 1, 0) 
39. [MJ] Sí. Una elección para x es (1, 2, 0, 0). 
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3 —5 

aa 
1 0 

la al S 


11. La transformación descrita T mapea e; en —e, y mapea e, 
en —e,. Una rotación de 7r radianes también mapea e; en 
—e; y mapea e, en —e,. Como una transformación lineal 
está completamente determinada por su acción sobre las 
columnas de la matriz identidad, entonces la transformación 
de rotación tiene el mismo efecto que T sobre cada vector 
en R?. 


13. xX 





T2, 1) 


T(e2) 
T(e;) 


n 


15. 


19. 


25. 


27. 


29. 


33. 


35. 


37. 


39. 


Jai i [i 2 0 o] 
0.0.0.0 

1. 0-1 17. 

das a 0 2 0 1 
0 1 0-1 


lo a el 


No es uno a uno, y no mapea R4 sobre R4. 




















No es uno a uno, pero mapea R? sobre R?. 


Oooo 
OSonmn * 
OE * * 


Sugerencia: Si ẹj es la j-ésima columna de 7,, entonces Bej es 
la j-ésima columna de B. 


Sugerencia: ¿Es posible que m > n? ¿Qué ocurre con m < n? 
[M] No. (Explique por qué). 


[M] No. (Explique por qué). 
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5. 


110 130 295 
4 3 9 ' 
a) xı 20 +X 18 |= 48 donde x, es el número 
A 5 8 | 


de porciones de Cheerios, y x2 es el número de porciones de 
100% Natural Cereal. 


110 130 
4 3 


xaf 9 . 
20 18 | | = 48 | Mezcle 1.5 porciones 
2 5 8 


295 
b) 


X2 


de Cheerios con 1 porción de 100% Natural Cereal. 


. a) Debería mezclar 0.99 porciones de Mac and Cheese, 1.54 


porciones de brócoli, y 0.79 porciones de pollo para obtener 
el contenido nutricional deseado. 


b) Debería mezclar 1.09 porciones de pasta integral y queso 
cheddar, 0.88 porciones de brócoli, y 1.03 porciones de 
pollo para lograr el contenido nutricional deseado. Observe 
que esta mezcla contiene significativamente menos brócoli, 
así que a ella le debería gustar más. 


1 -5 0 oJfh 50 
ae 10 —1 JE a o 
hh g i a al 30 
| 0o o0 -2 wlz —30 
L 3.68 
z h —1.90 
Mil 
da 2.49 


11. 


13. 


Respuestas a los ejercicios con numeración impar A23 


12 -7 0 E 40 
0 |- 15 -6 A Y A OA E 
o A a 20 
-4 0 5 —10 
I 11.43 
I 10.55 
[M]: 2 


=| |7] 8.04 
I, 5.84 
Xx+1 = Mx; para k =0, 1, 2,..., donde 


yelo W _ [800,000 
=| o7 .95| Y *=| 500,000 


Le z [741,720 
La población en el 2012 (para k = 2) es x2 = | 558.280 | 
.98363 .00167 
epea | .01637 a) 
30,754,500 
DMs ao 
[M] 


a) Disminuye la población de la ciudad. Después de 7 años, 
las poblaciones son aproximadamente iguales, pero la 
población de la ciudad continúa disminuyendo. Después 
de 20 años, en la ciudad solo hay 417,000 habitantes (valor 
redondeado a partir de 417,456). Sin embargo, cada año 
parecen reducirse los cambios en la población. 


b) La población de la ciudad se incrementa lentamente y 
disminuye la población suburbana. Después de 20 años, la 
población de la ciudad ha crecido de 350,000 a cerca de 
370,000. 
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1. 


a) F b) F c) V d) F ev fVv 
g) F h) F i) V JF k) V ly F 
m) V n) V 0) V pP) V q) F r) V 
s) F t) V u) F v) F w) F x) V 
DV JF 
a) Cualquier sistema lineal consistente cuya forma escalonada 
es 
Ho “koeko E 
0 * * o 0 0 E 
0. 0 0. 0 0 0 0 0 
0 n * * 
o 0 0 m * 


0 0 0 0 


b) Cualquier sistema lineal consistente cuya forma escalonada 
reducida es J. 


c) Cualquier sistema lineal inconsistente de tres ecuaciones 
con tres variables. 


a) El conjunto solución: i. es vacío si h = 12 y k + 2; 
ii. contiene una única solución si h # 12; iii. contiene 
una infinidad de soluciones si h = 12 y k = 2. 


b) El conjunto solución es vacío si k + 3h = 0; de lo contrario, 
el conjunto solución contiene una única solución. 
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7. 


10. 


11. 


12. 


13. 


15. 


16. 


17. 
19. 


21. 


25. 


2 —4 —2 
a) Sean vı = | —5 |, v2 = 1 |, v = l ly 
7 —5 -3 
bı 
b = | b, |. “Determine si vı, V2, V3 generan R?”. 
bz 
Solución: No. 
2 -4 2 
b) Sea A = | —5 1 1 |. “Determine si las columnas 
7-5 3 


de A generan R?”. 
c) Defina T(x) = Ax. “Determine si T mapea R? sobre R?”. 


JEEE 


Sugerencia: Construya una “malla” sobre el plano xıx2 
determinada por a; y a». 


Un conjunto solución es una recta cuando el sistema tiene 
una variable libre. Si la matriz de coeficientes es de 2 x 3, 
entonces dos de las columnas deberían ser columnas pivote. 

2 
0 3 
columna 3. La matriz resultante estará en forma escalonada. 
Haga una operación de remplazo de filas sobre la segunda fila 
para crear una matriz que no esté en forma escalonada, 


id 1 2 1 1 2 1 
alcomo| 3 1 1 s 21 


Sugerencia: ¿Cuántas variables libres hay en la ecuación 
Ax = 0? 


Por ejemplo, tome | * | Ponga lo que sea en la 


1 0 3 
E=|0 1 2 
0. 0.0 


a) Si los tres vectores son linealmente independientes, 
entonces a, c y f deben ser diferentes de cero. 
b) Los números a,..., f pueden tener cualesquiera valores. 


Sugerencia: Liste las columnas de derecha a izquierda 
Como Vj,..., Va. 


Sugerencia: Utilice el teorema 7. 


Sea M la recta que pasa por el origen que es paralela a la recta 
que pasa por V1, V2 y V3. Entonces, V2 — V¡ y V3 — v¡ están en 
M. De manera que uno de esos dos vectores es múltiplo del 
otro, por ejemplo, v2 — Vı = k(v3 — vı). Esta ecuación produce 
una relación de dependencia lineal: (k — 1)vı + v2 — kv3 =0. 

Una segunda solución: Una ecuación paramétrica de la recta 
es X = v¡ + 1(v2 — v1). Como vz está sobre la recta, existe 
alguna tọ tal que v3 = vı + to(v2 — v1) = (1 — to)vı + tov2. 
Así que v3 es una combinación lineal de vı y v2, y {V1, V2, V3} 
es linealmente dependiente. 





1 0 0 
0-1 0 23. a=4/5,b= -3/5 
0. 0 1 


a) El vector lista los números de apartamentos de 1, 2 y 3 
recámaras cuando se construyen xı pisos del plan A. 


3 4 5 
b) x| 7| +x|4]|+x%3|3 
8 8 9 


c) [M] Utilice 2 pisos del plan A y 15 pisos del plan B. 
O bien, use 6 pisos del plan A, 2 pisos del plan B, y 
8 pisos del plan C. Esas son las únicas soluciones 
factibles. Hay otras soluciones matemáticas, pero 
requieren un número negativo (o una fracción) de 
pisos en uno o dos de los planes, lo cual carece 
de sentido físico. 


Capítulo 2 
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24 0 2 3-5 3 e 
1. [e 10 e 6 3 |; no está definida, 
1 13 
-7 —6 
1 5 6 —15 
eeh] 


E 11 
5. a. Ab, = => , Ab, = 8 j, 
19 
-w 
E 
a e DEN 
A ENI 
5.4- < tE 
de 
zo 
7. 3x7 9 k=-2 
5 6 6 5 10 15 
11. AD = | 10 12 10|,D4A=|6 12 15 
15 15 12 6 10 12 


La multiplicación por la derecha por D multiplica cada 
columna de A por la entrada diagonal correspondiente 

en D. La multiplicación por la izquierda por D multiplica 
cada fila de A por la entrada diagonal correspondiente en D. 


13. Sugerencia: Considere que una de las dos matrices es O. 


ree el 


19. La tercera columna de AB es la suma de las primeras dos 
columnas de AB. He aquí por qué. Escriba B = [b; b bj]. 
Por definición, la tercera columna de AB es Abs. 
Si b; = bı + bz, entonces Ab3 = A(b; + b>)= Ab; + Ab», 
debido a una propiedad de la multiplicación matriz-vector. 


21. Las columnas de A son linealmente dependientes. 
¿Por qué? 


N 


3. Sugerencia: Suponga que x satisface Ax = 0, y demuestre 
que x debe ser 0. 


25. 


27. 


29. 


31. 


33. 


35. 


37. 
39. 
41. 


Sugerencia: Utilice los resultados de los ejercicios 23 y 24, y 
aplique la ley asociativa de la multiplicación al producto CAD. 


uy = vu = -3a+2b-5c, 
—3a —3b -—3c 
uv"=| 2a 2b  2cl, 
=5a —5b -—5c 
—3a 2a —54 
vu”=| —3b  2b —5b 
—3c 2c —5c 
Sugerencia: De acuerdo con el teorema 2b), demuestre que 


la entrada (i, j) de A(B + C) es igual a la entrada (i, j) de 
AB + AC. 


Sugerencia: Utilice la definición del producto Z„A y considere 
el hecho de que /,,X = X para toda x en R”. 


Sugerencia: Primero escriba la entrada (i, ¡) de (AB), que es 
la entrada (j, i) de AB. Después, calcule la entrada (i, j) en 
BTAT, y considere el hecho de que las entradas en la fila i 

de BY son bj;,..., Dni, porque provienen de la columna i de B, 
y el hecho de que las entradas en la columna j de AT son 
Aj1».-> Ajn, ya que provienen de la fila j de A. 


[M] Aquí la respuesta depende de la elección del programa 
de matrices. Para MATLAB, utilice el comando help 
para leer sobre zeros, ones, eye y diag. Para la TI-86, 
estudie las instrucciones dim, £i11 e iden. La TI-86 

no tiene un comando “diagonal”. 


[M] Muestre sus resultados e informe sus conclusiones. 
[M] Muestre sus resultados e informe sus conclusiones. 


Las matrices parecen aproximarse a la matriz 


1/3 1⁄3 1⁄3 
1/3 1/3 1/3 
1/3 1⁄3 1⁄3 
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a 


11. 


13. 


15. 


17. 
19. 


21. 


i Eo 3) 3. al le E 


xı =7yx = —9 


b: —9 11 6 13 
A es iS 
La demostración se puede modelar después de la demostración 


del teorema 5. 


AB = AC= A`! AB = A! ACs IB =1IC>B=C. 
No, en general, B y C pueden ser diferentes cuando A no 
es invertible. Véase el ejercicio 10 de la sección 2.1. 


Sugerencia: A la matriz [A, B], aplique las matrices elementales 
empleadas para reducir por filas A a /. 


D = C7!B71A”!, Demuestre que D funciona. 


Después de encontrar X = CB — A, demuestre que X es una 
solución. 


Sugerencia: Considere la ecuación Ax = 0. 


23. 


25. 


27. 


29. 


33. 


35. 


39. 


41. 
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Sugerencia: Si Ax = Q solo tiene la solución trivial, entonces 
no existen variables libres en la ecuación Ax = 0, y cada 
columna de A es una columna pivote. 


Sugerencia: Considere el caso a = b = 0. Después, considere 
el vector | p | y considere el hecho de que ad — bc = 0. 


Sugerencia: Para el inciso a), intercambie A y B en el cuadro 
que sigue al ejemplo 6 de la sección 2.1, y luego remplace 

B por la matriz identidad. Para los incisos b) y c), inicie 
escribiendo 


fila, (4) 
A= | fila,(A) 
filaz(A) 

8 3 1 

a a 31. | 10 4 1 

7/2 3/2 1/2 


La forma general de A”! es 


1 0 0 “0 
-1 1 0 0 


ar=p=| 0-1 1 


0 0 > l 1 
Sugerencia: Para j = 1,..., n, sean aj, b; y e, las j-ésimas 
columnas de A, B e I, respectivamente. Considere que 
aj — aj+ı = ej y bj = èj — ej+ı para j = 1, n — 1, 
y an = bn = en. 


3 
O |. Encuentre esto reduciendo por filas a [A ez]. 
—1 


1 1 —1 
E E 1 al 
[M] Las deflexiones son .62, .66 y .52 pulgadas, 


respectivamente. 


[M] .95, 6.19, 11.43 y 3.81 newtons, respectivamente. 
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La abreviación IMT denota el teorema de la matriz invertible (Inver- 
tible Matrix Theorem, teorema 8). 


1. 


Invertible, de acuerdo con el IMT. Ninguna columna de la 
matriz es un múltiplo de la otra columna, de manera que son 
linealmente independientes. Además, la matriz es invertible 
según el teorema 4 de la sección 2.2, ya que el determinante 
es diferente de cero. 


Observe que A” tiene un pivote en cada columna, de modo que 
de acuerdo con el IMT, A” es invertible. Entonces, según el 
IMT, A también es invertible. 


No es invertible, de acuerdo con el IMT. Como esta matriz 
tiene una columna de ceros, sus columnas forman un conjunto 
linealmente dependiente y, por consiguiente, la matriz no es 
invertible. 


A26 Respuestas a los ejercicios con numeración impar 


7.  Invertible, de acuerdo con el IMT. La matriz se reduce por 35. 
filas a 
mJ -3 0o 1 ] 
0 —4 8 0 | 
0 0 3 0 
0 0 0 1 | 
y tiene cuatro posiciones pivote. 37. 
9. [M] La matriz de 4 x 4 tiene cuatro posiciones pivote, así que 39. 


es invertible por el IMT. 


11. Sugerencia: Intente responder las preguntas apoyándose en una 
cuidadosa lectura del texto. 


13. Una matriz cuadrada triangular superior es invertible si y solo 
si todas las entradas de la diagonal son diferentes de cero. 
¿Por qué? 


Nota: Las respuestas que se muestran a continuación para los 41. 


ejercicios 15 a 29 mencionan al IMT. En muchos casos, una parte 
o la totalidad de una respuesta aceptable también podría basarse 
en resultados que se emplearon para establecer el IMT. 


15. No, porque el enunciado A) del IMT entonces sería falso. 
Una matriz de 4 x 4 no puede ser invertible cuando sus 
columnas no generan R4. 


17. Si A tiene dos columnas idénticas, entonces sus columnas son 
linealmente dependientes. El inciso e) del IMT indica que A 
no puede ser invertible. 


19. Des invertible por el enunciado e) del IMT. Así, la ecuación 
Dx = b tiene una solución para cada b en R7, de acuerdo con 
el enunciado g) del IMT. ¿Podría agregar algo más? 


21. La matriz C no puede ser invertible, de acuerdo con el 
teorema 5 de la sección 2.2 o según el párrafo después 
del IMT. Así, el enunciado g) del IMT es falso y también 


lo es h). Las columnas de C no generan R”. 43. 


23. El enunciado g) del IMT es falso para F, de manera que 
también es falso el enunciado d). Es decir, la ecuación 
Fx = 0 tiene una solución no trivial. 


45. 


25. Sugerencia: Primero utilice el IMT. 


27. Sea W la inversa de AB. Entonces, ABW = I y A(BW) = I. 
Por desgracia, esta ecuación por sí misma no prueba que A 
es invertible. ¿Por qué no? Termine la demostración. 


29. Como la transformación x > Ax es uno a uno, entonces el 
enunciado f) del IMT es verdadero. También es verdadero el 
enunciado i), y la transformación x —> Ax mapea R” sobre R”. 
También, A es invertible, lo cual, de acuerdo con el teorema 9, 1 
implica que la transformación x > Ax es invertible. 


31. Sugerencia: Si la ecuación AX = b tiene una solución para 5. 


. X= A”! (¿por qué?), Y = —BA”!, Z = 0 (¿por qué?) 


cada b, entonces A tiene un pivote en cada fila (teorema 4 7 
de la sección 1.4). ¿Podrían existir variables libres en una 


ecuación Ax = b? 9. 


33. Sugerencia: Primero demuestre que la matriz estándar de Tes 


invertible. Entonces, utilice un teorema o más para demostrar 13. 


que T7Ux) = Bx, donde B = E | 


Sugerencia: Para demostrar que T es uno a uno, suponga que 
T(u) = T(v) para algunos vectores u y v en R”. Deduzca 
que u = v. Para demostrar que T es sobre, suponga que y 
representa un vector arbitrario en R” y utilice la inversa S 
para producir una x tal que T(x) = y. Es posible dar una 
segunda demostración empleando el teorema 9 junto con 

un teorema de la sección 1.9. 


Sugerencia: Considere las matrices estándar de T y U. 


Si T mapea R” sobre R”, entonces, de acuerdo con el teorema 
12 de la sección 1.9, las columnas de su matriz estándar A 
generan R”. Según el IMT, A es invertible. Así, de acuerdo con 
el teorema 9, T es invertible, y A`! es la matriz estándar de 
T71, Como A”! también es invertible, entonces, según el IMT, 
sus columnas son linealmente independientes y generan R”. Al 
aplicar el teorema 12 de la sección 1.9 a la transformación T”! 
se muestra que 7”! es un mapeo uno a uno de R” sobre R”. 


[M] 

a) La solución exacta de (3) es xı = 3.94 y x2 = .49. La 
solución exacta de (4) es xı = 2.90 y x2 = 2.00. 

b) Cuando la solución de (4) se emplea como una 
aproximación para la solución de (3), el error al usar 
el valor de 2.90 para x, es aproximadamente del 26%, 
y el error al utilizar 2.0 para x, es de alrededor 
del 308%. 


c) El número de condición de la matriz de coeficientes 
es 3363. El cambio porcentual en la solución de (3) a 
(4) es cerca de 7700 veces el cambio porcentual en el 
lado derecho de la ecuación. Este es el mismo orden de 
magnitud que el número de condición. Este último da una 
medida aproximada de qué tan sensible es la solución de 
Ax = b ante cambios en b. Información adicional sobre 
el número de condición se presenta al final del capítulo 6 
y en el capítulo 7. 


[M] cond(A) = 69,000, que está entre 10* y 105. Así que se 
pueden perder 4 o 5 dígitos de exactitud. Varios experimentos 
con MATLAB deberían comprobar que x y xı concuerdan 

a 11 o 12 dígitos. 


[M] Algunas versiones de MATLAB emiten una señal de 
alerta cuando se pide invertir una matriz de Hilbert de orden 
cercano a 12 o mayor, empleando aritmética de punto flotante. 
El producto AA™! debería tener varias entradas fuera de la 
diagonal que están lejos de ser cero. Si no, intente con una 
matriz más grande. 
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A B 3 C D 
EA+C EB + D `A B 


Y = B`! (explique por qué), X = —B7! A, Z = C 


An =—BaB;¡!, As =—B3B;!, 
Cn = Bn — Ba B;¡¡'Br 


Sugerencia: Suponga que A es invertible, y sea 


ael 


E 
F G | Demuestre que BD = I y CG = 1. 


15. 


17. 


19. 


21. 


23. 


25. 


27. 


Esto implica que B y C son invertibles. (¡Explique por qué!). 
Al contrario, suponga que B y C son invertibles. Para probar 
que A es invertible, indique cómo debería ser A”! y 
compruebe que su propuesta funciona. 


XT 
Gr+1 = [Xx Xk+ ] E | = X Xf + Xk Xi p 


k+1 
= G; + Xk+IX 41 
Solo se necesita calcular el producto matricial exterior 
XX (y después se suma a Gz). 


; 10 10 PA IY 
La inversa de y ea y |.0e manera similar, | r 


tiene una inversa. De la ecuación (7), se obtiene 


I 0 Ái Ap I -Y = Ái 0 (=) 
-X I||Aáa z|o I| |0 Ss 


Si A es invertible, entonces la matriz del lado derecho de 
(*) es un producto de matrices invertibles y, por lo tanto, 
es invertible. De acuerdo con el ejercicio 13, 411 y S deben 
ser invertibles. 


W(s) = Im — C(A — sI) 71B. Este es el complemento de Schur 
de A — sl, en la matriz del sistema. 


1 01 o0 
2) pel alh A 


_[1+0 0+0 ] f1 0 
[2-2 0+61°P| [o 1 


A olfa o 
meli a Sn 


_[az+0 0+0 TJ_T7 0 
[44 orcar]=lo 7) 


Si Aı y Bı son (k + 1) x (k + 1) y triangulares inferiores, 


o b ~ 
basf al 


donde A y B son de k x k y triangulares inferiores, v y w 
están en R$, y a y b son escalares adecuados. Suponga que 
el producto de matrices triangulares inferiores de k x k es 
una matriz triangular inferior, y calcule el producto A¡B). 
¿Qué se concluye? 


, a 
entonces escriba A; = | ` 


Utilice el ejercicio 13 para encontrar la inversa de una matriz 
B 11 0 

0 Bn 
es de q x q, y B es invertible. Particione la matriz A, y aplique 
dos veces su resultado para encontrar que 


de la forma B = | | donde B; es de p x p, B22 


-5 2 0 0 0 

3 -l 0 0 I 

¿ee 00 o 1/2 0 0 | 
0 0 0 3  —4 

| 0 0 0  -5/2 m 


a), b) Las instrucciones empleadas en estos ejercicios 
dependen del programa de matrices. 

c) El álgebra requerida viene de la ecuación matricial 
por bloques 


An 0 Xi p|_ b; 

Az Az X2 b2 
donde x; y b; están en R”, y x3 y bz están en R°. 
Entonces, A11Xx1 = b4, lo cual se puede resolver para 


Respuestas a los ejercicios con numeración impar A27 
obtener x4. La ecuación A71X¡ + A22X, = b¡ conduce 
a Az, =b, — A71X,, de la que se puede obtener x> 
mediante reducción por filas de la matriz [4 el, 
donde ¢ = b2 = A21X1. 
Sección 2.5, página 129 
-7 3 
1. ly=b>y=|-2|,Ux=y>x= 4 
6 —6 
5] [= I 
3 y= 12 |, x= —4 5 y= X= 
0 0 1 8.5 
—4 —4 
1 o[p[2 5 
ed e JE a 
1 0 0 3 1 2 
9: 13 1 0 0 3 2 
3-2 1 0 0 4 
1 0. 0 3 ep 2 
11. 2 1 0 0 5 0 
-1 1 1 0 0 5 
1 0 0 0 1 3-5 3 
13. -1 1 0 0 0-2 3 1 
4 5 1 0 0o 0 0 0 
—2 -1 0 1 0 0 0. 0 
1 0. 0 2 0 5 2 
15. | -3 1 0 0 3 2 3 
2 3 1 0 0 0 4 
1/2 —3/4 -2 
17. UT! = 0 -—1/4 —1 |, 
0 0 —1/2 
1 0 0 
Ent= 2 1 0 |, 
—2 -1 1 
3 5/4 -2 
A™! = | 3/2 3/4 -1 
1 1/2 -1/2 


19. Sugerencia: Piense en aplicar reducción por filas a [A 1]. 


21. Sugerencia: Represente las operaciones de fila mediante una 
secuencia de matrices elementales. 


23. a) Denote las filas de D como transpuestas de vectores 
columna. Entonces, con la multiplicación matricial 
particionada se obtiene 


Y 
A=CD=[¢c i ca] 


Ps 


= cv? +- + evi 


b) A tiene 40,000 entradas. Como C tiene 1600 entradas y 
D tiene 400 entradas, entonces juntas solo ocupan el 5% 
de la memoria necesaria para almacenar A. 
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25. Explique por qué U, D y V7 son invertibles. Después, utilice 1.6 111.6 
un teorema sobre la inversa de un producto de matrices 7. a) 12 b) 121.2 
invertibles. ea 
c) Sugerencia: Encuentre una fórmula que implique (1 — C)”?. 
ži; 82.8 
9. x= | 131.0 
110.3 
11. Sugerencia: Utilice propiedades de transpuestas para 
obtener p” = pC + v” de manera que 
px = (p"C + v)x = p*Cx + v”x. Ahora calcule p”x 
con la ecuación de producción. 
13. [M] x = 
(99576, 97703, 51231, 131570, 49488, 329554, 13835). 
Las entradas en x sugieren más precisión en la respuesta 
que está garantizada por las entradas en d, que parece ser 
29. a) | 1+ R3/Ra Ri R; — (R1 R3)/R2 | exacta quizá solamente al millar más cercano. Así que una 
=1/R> 1+ Rı/R2 respuesta más realista para x podría ser 
3 43 x = 1000 x (100, 98, 51, 132, 49, 330, 14). 
ts | —1/3 5/3 | 15. [M] x“? es el primer vector cuyas entradas son exactas al 
1 6 1 oli 2 millar más cercano. El cálculo de x(1? requiere cerca de 
2 Lo f | | -1/3 1 | 1 1 | 1260 flops, mientras que la reducción por filas de [Y — Cid] 
necesita solamente alrededor de 550 flops. Si C es mayor de 
Sean Rı = 2 ohms, R2 = 3 ohms y R3 = 6 ohms 20 x 20, entonces se necesitan menos flops para calcular x"2 
mediante iteración que para determinar el vector de equilibrio 
31. [M] x por reducción de filas. Conforme aumenta el tamaño de C, 
1 o o o 0 o o. 0 se incrementa la ventaja del método iterativo. También, cuando 
225 l 0 o 0 0 o o0 C se vuelve más dispersa para modelos grandes de economía, 
—.25 —.0667 1 o 0 0 o o E a . itud 
y | e = -as i à J a entonces se requieren menos iteraciones para una exactitu 
a T o O —.2679 —.0833 1 0 o o razonable. 
0 o 0 —2917 —.2921 1 o o 
0 o 0 o —.2697 —0861 1 0 
0 o 0 o O —.2948 —2931 1 en o. 
Sección 2.7, página 144 
41 o o 0 0 o 
0 375 —25 1 o 0 0 o 1.25 0 o =i -1 
O 0 3.7333 —1.0667 —1 0 0 o 
b U=? ? O 3.4286 —.2857  —1 0 o 1. |0 1 0 3 |1 0 2 
Tjo o 0 O 3.7083 —10833  —1 0 0 0 1 o 0 1 
o o 0 o O 33919 —.2921 —I 
o o 0 o o O 3.7052 —1.0861 
o o 0 0 o o O 3.3868 1/V2 1/42 p 
5. |1/Y92 -1/Y92 0 
2953 0866 .0945 .0509 .0318 .0227 .0100 0082 0 0 1 
.0866 2953 .0509 .0945 .0227 .0318 .0082  .0100 
.0945 0509 .3271 .1093 .1045 .0591 .0318 .0227 
e) AT! =| 0509 0945 1093 3271 .0591 1045 0227 0318 1/2 =43/2 34443 
= | 0318 0227 .1045 .0591 .3271 1093 .0945  .0509 7. | 3/2 1/2 4-33 
.0227 0318 .0591 .1045 .1093 3271 .0509 .0945 0 0 1 
0100 0082 .0318 .0227 .0945 .0509 .2953 0866 
0082 .0100 .0227 .0318 .0509 .0945 .0866  .2953 g a 
Véase el problema de práctica. 
Obtenga A”! directamente y después calcule 
AT! — UTIL?! para comparar ambos métodos de 9. A(BD) requiere 800 multiplicaciones. (AB)D necesita 408 
inversión matricial. multiplicaciones. El primer método utiliza casi el doble de 


multiplicaciones. Si D tuviera 10,000 columnas, las cuentas 
serían 80,000 y 40,008, respectivamente. 


Sección 2.6, página 136 11. Considere el hecho de que 








.10 .60  .60 d d 60 : 5 
1. C=|.30 20 0 S 20 a MES 
0 10 Aó intermedia 10 sec p — tan p sen p = o. ae cos p 
A 
AAAA 110 13. A P|- L p T y . Primero aplique la 
3. x= | 16.67 £ x= lao. o 1 or iio 1 
16.67 


transformación lineal A, y después traslade mediante p. 


15. 


19. 


21. 


0 0 
1/2 —vY3/2 

v3/2 1/2 
0 0 


(12, —6, —3) 17. 


D O O 
j D O O 


El triángulo con vértices en (7, 2, 0), (7.5, 5, 0) y (5, 5, 0) 


2.2586 
—1.3495 
.0910 


—1.0395 
2.3441 
—.3046 


—.3473 X R 
.0696 Y |=|G 
1.2777 Z B 


[M] 


27. 


Sección 2.8, página 151 


1. 


11. 


13. 


15. 


17. 


19. 


21. 


23. 


El conjunto es cerrado bajo sumas, pero no bajo multiplicación 29, 


por un escalar negativo. (Bosqueje un ejemplo). 


El conjunto no es cerrado bajo sumas o múltiplos escalares. 31. 


Sí. El sistema correspondiente a [v, v2 w]es consistente. 


a) Los tres vectores V1, V2 y V3. 


b) Una infinidad de vectores. 


c) Sí, porque Ax = p tiene una solución. 33. 


No, porque Ap % 0. 


p = 4y q = 3. Nul A es un subespacio de R4 porque las 
soluciones de Ax = 0 deben tener cuatro entradas, para 


ajustar con las columnas de A. Col A es un subespacio 35. 


de R? porque cada vector columna tiene tres entradas. 


Para Nul A, elija (1, —2, 1, 0) o (—1, 4, 0, 1), por ejemplo. 
Para Col A, seleccione cualquier columna de A. 


Sea A la matriz cuyas columnas son los vectores dados. 37 


Entonces, A es invertible porque su determinante es diferente 
de cero, y así sus columnas forman una base para R?, de 
acuerdo con el IMT (o con el ejemplo 5). (Se podrían dar 
otras razones para la invertibilidad de A). 


Sea A la matriz cuyas columnas son los vectores dados. 
La reducción por filas muestra tres pivotes, así que A es 
invertible. Según el IMT, las columnas de A forman una 
base para R3. 


Sea A la matriz de 3 x 2 cuyas columnas son los vectores 
dados. Las columnas de A posiblemente no puedan generar 
R? porque A no puede tener un pivote en cada fila. Así, las 
columnas no son una base para R?. (Estas son una base para 
un plano en R3). 


Sugerencia: Lea la sección con cuidado, y escriba sus 
respuestas. Esta sección tiene términos y conceptos 
clave que debe aprender antes de seguir adelante. 


4 5 
Base para Col A:| 6 |,| 5 
3 4 


Base para Nul A: 


Roman 


25. 


oa Je 
3. [>| 5. B 7. [w]s 


9. 
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1 4 -3 
1 2 3 
Base para Col A: 2bl2 b 5 
3 6 =5 
2 = 
—2.5 5 
Base para Nul A: Le 0 
0 —4 
0 1 
Construya una matriz A de 3 x 3 distinta de cero, y 
construya b como una combinación lineal conveniente 
de las columnas de A. 
Sugerencia: Se necesita una matriz distinta de cero cuyas 


columnas sean linealmente dependientes. 


Si Col F + R5, entonces las columnas de F no generan R5. 
Puesto que F es cuadrada, el IMT indica que F no es invertible 
y la ecuación Fx = 0 tiene una solución no trivial. Es decir, 
Nul F contiene un vector diferente de cero. Otra manera de 
describir esto es escribir Nul F + (0). 


Si Nul C = {0}, entonces la ecuación Cx = 0 solo tiene la 
solución trivial. Como C es cuadrada, el IMT indica que C es 
invertible y la ecuación Cx = b tiene una solución para cada 
b en Rî. Además, cada solución es única de acuerdo con el 
teorema 5 de la sección 2.2. 


Si Nul B contiene vectores diferentes de cero, entonces la 
ecuación Bx = 0 tiene soluciones no triviales. Como B es 
cuadrada, el IMT indica que B no es invertible y las columnas 
de B no generan R5. Así, Col B es un subespacio de R5, pero 
Col B + R5. 


[M] Muestre la forma escalonada reducida de A, y seleccione 
las columnas pivote de A como una base para Col A. 

Para Nul A, escriba la solución de Ax = 0 en forma 

vectorial paramétrica. 


3 —5 
—7 9 
Base para Col A: sl 7 
3 —7 
—2.5 4.5 —3.5 
—1.5 2.5 =1.5 
Base para Nul A: 1, 0 5 0 
0 1 0 
0 0 1 
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Il 
AAA 

=N Il 
——— m~ 
n =. a 
>x LY 
a 

Il 
nn 

ES 

U U 
u 


Base para Col A: 
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-3 


Base para Nul A: ; dim Nul A = 1 


O O m. 


| ; 
3 
11. Base para Col A: 


| dim Col A = 2 


Base para Nul A: —1 |; dim Nul A = 3 


0 1 0 
0 0 1 
13. Los vectores v1, V3 y va forman una base para el subespacio 
dado, H. Así, dim H = 3. 


15. Col A = R*, porque A tiene un pivote en cada fila, y así las 
columnas de A generan R*. Nul A no puede ser igual a R? 
porque Nul A es un subespacio de R. Sin embargo, es cierto 
que Nul A es bidimensional. La razón es que la ecuación 
Ax = 0 tiene dos variables libres, porque A tiene seis 
columnas, y solo cuatro de ellas son columnas pivote. 


19. El hecho de que el espacio solución de Ax = 0 tenga una 
base de tres vectores significa que dim Nul A = 3. Como una 
matriz A de 5 x 7 tiene siete columnas, entonces el teorema 
del rango indica que rango A = 7 — dim Nul A = 4. 


21. Una matriz de 9 x 8 tiene ocho columnas. De acuerdo con 
el teorema del rango, dim Nul A = 8 — rango A. Como el 
rango es 7, entonces dim Nul A = 1. Es decir, la dimensión 
del espacio solución de Ax = 0 es 1. 


23. Cree una matriz A de 3 x 5 con dos columnas pivote. 
Las restantes tres columnas corresponderán a variables libres 
en la ecuación Ax = 0. De manera que sí es posible 
la construcción deseada. 


25. Por definición, las p columnas de A generan Col A. 
Si dim Col A = p, entonces el conjunto generador de p 
columnas automáticamente es una base para Col A, de 
acuerdo con el teorema de la base. En particular, las 
columnas son linealmente independientes. 


27. a) Sugerencia: Las columnas de B generan W, y cada 
vector aj está en W. El vector c; está en R ya que B 
tiene p columnas. 


b) Sugerencia: ¿Cuál es el tamaño de C? 


c) Sugerencia: ¿Cómo se relacionan B y C con A? 


29. [MI] Los cálculos deberían mostrar que la matriz [vı v2 x] 
corresponden a un sistema consistente. El vector de 
B-coordenadas de x es (2, —1). 
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1. aV bF AV AF ƏAF PF 
gV HV ÖV ĎE BV DF 


2 


za 


11. 


13. 


15. 


17. 


19. 


m) F n) V 0) F pP) V 


I 


4A? = 2A — I. Multiplique por A: A? = 24? — A. 

Sustituya A? = 2A — 1: 

A =2(Q2A —I)-A=3A — 21. 

Multiplique por A otra vez: A* = A(3A — 21) = 34? — 24. 
Otra vez sustituya la identidad A? = 2A — T: 

A*= 3(2A — 1) — 24 =4A — 31. 


10 1 
9 10 9. k z] 
-5 -3 


n—1 


a) p(xi) = Co + 61X; ++ + Cp-1X; 


Co 


= fila;(V) - = fila;(Ve) = y; 


Cn—1 


b) Suponga que x1,..., Xn son distintos y suponga que Ve 
= Q para algún vector e. Entonces, las entradas en e son 
los coeficientes de un polinomio cuyo valor es cero en 
los distintos puntos xj,..., Xx». Sin embargo, un polinomio 
diferente de cero de grado n — 1 no puede tener n ceros, 
así que el polinomio debe ser idénticamente cero. Es decir, 
todas las entradas en e deben ser cero. Esto muestra que las 
columnas de V son linealmente independientes. 


c) Sugerencia: Cuando xj,..., X, SON diferentes, existe un 
vector c tal que Ve = y. ¿Por qué? 


a) P? = (uu) (uu) = u(u'u)u” = u(1)u? = P 
b) P" = (w) = uu" = wu = P 
c) Q? = (I —2P)(I —2P) 

=1-12P)-2PI +2P(2P) 

= I — 4P + 4P? = l, debido al inciso a). 


La multiplicación por la izquierda por una matriz elemental 
produce una operación de fila elemental: 


B ~ EiB ~ EEB ~ E3E,EıB = C 


Así, B es equivalente por filas a C. Como las operaciones 
de fila son reversibles, C es equivalente por filas a B. 
(Alternativamente, muestre a C que cambia a B mediante 
operaciones de fila empleando las inversas de las £E;). 


Como B es de 4 x 6 (con más columnas que filas), sus 
seis columnas son linealmente dependientes y existe una 
x diferente de cero tal que Bx = 0. Así, ABx = A0 = 0, 

lo que indica que la matriz AB no es invertible, de acuerdo 
con el IMT. 


[M] Con cuatro cifras decimales, conforme k se incrementa, 


.2857 .2857  .2857 
AF => | .4286 .4286 .4286 | y 
2857 .2857  .2857 


.2022 .2022  .2022 
B* >| .3708 .3708  .3708 
.4270 .4270  .4270 


o, en formato racional, 


2/7 2/7 2/7 
Ak > | 3/7 3/7 3/7 y 
2/7 2/7 2/7 


18/89 18/89 18/89 
B* => | 33/89 33/89 33/89 
38/89 38/89 38/89 
Capítulo 3 
Sección 3.1, página 167 
1. 1 3. —5 5. -23 7. 4 
9. 10. Inicie con la fila 3. 
11. —12. Inicie con la columna 1 o la fila 4. 
13. 6. Inicie con la fila 2 o la columna 2. 
15. 1 17. —5 
19. ad — bc, cb — da. Intercambiando dos filas cambia el signo 
del determinante. 
21. —2, (18 + 12k) — (20 + 12k) = —2. Un remplazo de fila 
no cambia el valor de un determinante. 
23. —5, k(4) — kQ) + k(-7) = —5k. Escalar una fila por una 
constante k multiplica el determinante por k. 
25. 1 27. k 29. —1 
31. 1. La matriz es triangular superior o inferior, únicamente 
con 1 sobre la diagonal. El determinante es 1, el producto 
de las entradas diagonales. 
c d 
33. det EA = det E 7 e cb — ad = (—1)(ad — bc) 
= (det E) (det A) 
35. det EA = aer [“ Thep a 
c d 
= (a + kc)d — (b + kd )c 
=ad + kcd — bc — kdc = (+1) (ad — bc) 
= (det E) (det 4) 
15 5 
37. 5A = E il no 
41. El área del paralelogramo y el determinante de [u v] son 
iguales a 6. Si y = H para cualquier x, el área continúa 
siendo 6. En cada caso no cambia la base del paralelogramo, 
y la altura permanece en 2 porque la segunda coordenada 
de v siempre es 2. 
43. [M] En general, det(A + B) no es igual a det A + det B. 
45. [M] Puede revisar sus conjeturas cuando llegue a la 


sección 3.2. 
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Sección 3.2, página 175 


1. 
3. 


13. 
21. 
25. 
29. 
31. 
33. 
35. 


37. 


39. 
41. 


43. 


45. 


El intercambio de dos filas invierte el signo del determinante. 


Una operación de remplazo de filas no modifica el 
determinante. 


3 7. 0 9. 3 11. 120 
6 15. 35 17. —7 19. 14 
Invertible 23. No es invertible 


Linealmente independiente. 

—32 

Sugerencia: Demuestre que (det A)(det Ah =]. 
Sugerencia: Utilice el teorema 6. 


Sugerencia: Aplique el teorema 6 y algún otro. 


6 0 
det AB = det 17 da 24; 


(det A)(det B) = 3 - 8 = 24 
a) 212 b) 500 c) -3 d)] e) 64 


det A = (a + e)d — (b + f)c =ad + ed — bc — fc 
= (ad — bc) + (ed — fc) = det B + det C 


Sugerencia: Calcule det A con desarrollo por cofactores a lo 
largo de la columna 3. 


[M] Exprese su conjetura sobre ATA y AAT. 
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1. 


11. 


13. 


15. 


17. 


¡ia n 





-7/2 
5s +4 —4s — 15 
EOS gp PET a S 
SÉ EVJ ži ee. T => 
1 4s +3 
s #0,-1; x1= y= Sr 
3(s +1) 6s(s + 1) 
0o ıı 0 O 
EN E E A E A E 
306 e 2 6 
api 5 [- -1 5 
ajA4A=| 1 -5 1ļl,a=-| 1 -5 1 
E IS a5 
2 0 0 Mewa 
ajA=| 2 6 0| AT=¿| 2 6 0 
-1 -9 3 -1 -9 3 


Si A = k T entonces C11 = d, Ci2 = —c, Cai = —b, 


Cn = a. La matriz adjunta es la transpuesta de la matriz 
de cofactores: 


aja =] a E 
=€ a 
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Siguiendo al teorema 8, divida entre det A; esto produce la 
fórmula de la sección 2.2. 
19. 8 21. 14 23. 22 
25. Una matriz A de 3 x 3 no es invertible si y solo si sus 
columnas son linealmente dependientes (de acuerdo con el 
teorema de la matriz invertible). Esto ocurre si y solo si una 


de las columnas está en el plano generado por las otras dos 
columnas, lo cual es equivalente a la condición de que el 


paralelepípedo determinado por esas columnas tiene volumen 


cero, lo cual, a la vez, equivale a la condición det A = 0. 


27. 24 29. 3|det[v,  v2]l 


31. a) Véase el ejemplo 5. b) 4rrabc/3 


33. [M] En MATLAB, las entradas en B — inv(A) son 
aproximadamente 10715 o más pequeñas. 


35. [MJ] La versión estudiantil 4.0 de MATLAB utiliza 
57,771 flops para inv(A), y 14,269,045 flops para la fórmula 
inversa. El comando inv (A) solamente requiere cerca del 
0.4% de las operaciones para la fórmula inversa. 


Capítulo 3 Ejercicios complementarios, página 185 

1. a) V b) V c) F d) F e) F PE 
2gV mV DE FE BV DF 
m) F n) V 0) F pP) V 


La solución del ejercicio 3 se basa en el hecho de que si una matriz 


contiene dos filas (o dos columnas) que son múltiplos entre sí, 
entonces, de acuerdo con el teorema 4, el determinante de la 
matriz es cero, ya que la matriz no puede ser invertible. 


3. Realice dos operaciones de remplazo de filas, y después 
factorice un múltiplo común en las filas 2 y 3. 


1 a b+c 1 a b+c 
1 b a+c|=/0 b-—a a—b 
1 c a+b 0 c-a a=c 
1 a b+c 
= (b—a)\(c-a)| 0 1 —1 
0 1 —-1 
=0 
5. —12 


7. Cuando el determinante se desarrolle por cofactores de la 
primera fila, la ecuación tiene la forma ax + by + c = 0, 
donde al menos a o b no valen cero. Esta es la ecuación de 
una recta. Es claro que (x1, y1) y Qu, yo) están sobre la recta, 
porque cuando las coordenadas de uno de los puntos se 
sustituyen por x y y, dos filas de la matriz son iguales y, 
de esta forma, el determinante es cero. 


11. 


13. 


15. 


17. 


19. 


1 a a? 
T=|0 b=a b? — a? |. Así, de acuerdo con el 
0 c-a e-ga 
teorema 3, 
1 a a? 
det T = (b —a)(c—a)det| 0 1 b+a 
0 1 c+a 
1 a a? 
=(b—alMc—a)det| O 1 b+a 
0 0 c—b 


= (b —a)(c — a)(c — b) 


Área = 12. Si se resta un vértice de los cuatro vértices, y si los 
nuevos vértices son 0, v1, V2 y V3, entonces la figura trasladada 
(y por lo tanto, la figura original) será un paralelogramo si y 
solo si uno de los vectores v1, V2 y V3 es la suma de los otros 
dos vectores. 


1 
Según la fórmula inversa, (adj 4) - — A = A™!A = 1. 
det A 


Según el teorema de la matriz invertida, adj A es invertible 


adj A)! = — 

y (adj A) El 

a) X=CA”!, Y =D — CA”!B. Ahora utilice el ejercicio 
14c). 

b) A partir del inciso a), y de la propiedad multiplicativa 
de los determinantes, 


de p)= det A(D-CA71B)] 
=det[ AD— ACAB] 
= det [ AD — CAA™! B] 
= det[ AD — CB] 
donde la igualdad AC = CA se aplicó en el tercer paso. 


Primero considere el caso n = 2, y demuestre que el resultado 
es válido mediante cálculo directo de los determinantes de B 

y C. Ahora, suponga que la fórmula es válida para todas las 
matrices (k — 1) x (k — 1), y sean A, B y C matrices de k x k. 
Utilice un desarrollo por factores a lo largo la primera columna 
y la hipótesis inductiva para obtener det B. En C aplique 
operaciones de remplazo de filas para generar ceros debajo 

del primer pivote y así producir una matriz triangular. 
Encuentre el determinante de esta matriz y súmelo a det B 

para obtener el resultado. 


[M] Calcule: 


1 1 1 1 
1 1 1 
1 2 2ļ|=1, D e A 
I 2 3 Lo 2 o gy 
lA E 
1 1 1 1 1 
Daz. 2 ¿Ze “2 
Ll. 2.3.3 3121 
1.2.3 4 4 
1.2.3. 4 o.5 


Suposición: 
1 1 Do 1 
1 2 
1.2 3 bsi 
1.2.3... n 


Para confirmar la suposición, utilice operaciones de remplazo 
de filas para generar ceros bajo el primer pivote, después bajo 
el segundo pivote, y así sucesivamente. La matriz resultante es 


1 1 1 1 
0o 1l 1 1 
0 0 1 1 
o 0 0 1 


que es una matriz triangular superior con determinante 1. 


Capítulo 4 


Sección 4.1, página 195 


1. 


11. 


13. 


15. 


17. 


19. 


a) u + v está en V porque sus entradas son no negativas. 


b) Ejemplo: Si u = 3 


2 | yc = —1, entonces u está en V, 


pero cu no está en V. 
; .5 
Ejemplo: Si u = | | y c = 4, entonces u está en H, pero 


cu no está en H. 


Sí, de acuerdo con el teorema 1, porque el conjunto es 
Gen (1?). 


No, el conjunto no es cerrado bajo multiplicación por escalares 
que no sean enteros. 


—2 
H = Gen {v}, donde v = 5 |. Según el teorema 1, H es 
3 
un subespacio de R?. 
2 3 
W = Gen {u, v}, donde u = | —1 |,v= | 0 |. Según el 
0 2 


teorema 1, W es un subespacio de [R3, 


a) Solo existen tres vectores en {V1, V2, V3}, y W no es uno 
de ellos. 


b) Hay una infinidad de vectores en Gen {v1, V2, V3}. 


c) w está en Gen {vV1, V2, V3} porque w = vı + v2. 


W no es un espacio vectorial porque el vector cero no está 
en W. 
2 -1 0 
ala 
=1 |” 0 |” 3 
JLS Lo) 


Sugerencia: Utilice el teorema 1. 


S= 


21. 


25. 


29. 


31. 


33. 


35. 


37. 


Respuestas a los ejercicios con numeración impar A33 


Sí. Evidentemente, se satisfacen las condiciones para un 
subespacio: la matriz cero está en H, la suma de dos matrices 
triangulares superiores es triangular superior, y cualquier 
múltiplo escalar de una matriz triangular superior es otra vez 
triangular superior. 


4 27. a) 8 b) 3 c) 5 d) 4 


u+ (—1)u = lu+ (—1)u Axioma 10 
[ + (—1)]u 


= 04 =0 


Axioma 8 


Ejercicio 27 


Del ejercicio 26, se deduce que (—1)u = —u. 


Cualquier subespacio H que contiene a u y v también debe 
contener todos los múltiplos escalares de u y v; por lo tanto, 
debe contener todas las sumas de los múltiplos escalares de 
u y de v. Por consiguiente, H debe contener a Gen {u, v}. 


Sugerencia: Para una parte de la solución, considere w; y 
w2en H + K, y escriba w; y w2 en la forma w; = u; + vı 
y w2 = W + va, donde u; y uz están en H, y vı y v2 están 
en K. 


[M] La forma escalonada reducida de [v1, V2, V3, w] muestra 
que w = vı — 2v2 + v3. Por lo tanto, w está en el subespacio 
generado por V1, V2 y V3. 


[M] Las funciones son cos(4t) y cos(6f). Véase el ejercicio 34 
de la sección 4.5. 
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11. 


3 —5 es 1 0 
62 0 3ļl=lo0], 
-8 4 1ıl|—4 0 


de manera que w está en Nul A. 


2774 iJ T 
E o 1 0 
; 5 |oj | 5 

1 0 
6 i 0 1 
0 0 


W no es un subespacio de R? ya que el vector cero (0, O, 0) 
no está en W. 


W es un subespacio de [R* porque W es el conjunto de 
soluciones del sistema 


p=3q — 4s =0 
2p = s=5r=0 


W no es un subespacio porque 0 no está en W. Justificación: Si 
un elemento típico (s — 2t, 3 + 3s, 3s + t, 2s) fuera cero, 
entonces 3 + 3s = 0 y 2s = 0, lo que es imposible. 


A34 Respuestas a los ejercicios con numeración impar 


1 —6 
13. W = Col A para A = | O 1 j, así que W es un espacio 
1 0 


vectorial, de acuerdo con el teorema 3. 


0 32 1 
1 —1 2 
15. 3 1 0 
2 -1 -—1 


17. a) 2 b) 4 19. a) 5 b) 2 


6 


21. El vector | 2 está en Col A. 


3 | está en Nul A y el vector z 


Son posibles otras respuestas. 


23. w está tanto en Nul A como en Col A. 


3 1 -3 -3 
27. Sean x = 2|y4A=|-2 4 2 |.Así, x está en 
—1 -1 5 7 


Nul A, y como este es un subespacio de R?, entonces 10x 
se encuentra en Nul A. 
29. a) A0 =0, por lo que el vector cero está en Col A. 


b) Por una propiedad de la multiplicación matricial, 
Ax + Aw = A(x + w), lo que indica que Ax + Aw es 
una combinación lineal de las columnas de A y, por 
lo tanto, está en Col A. 


c) c(Ax) = A(cx), lo que muestra que c(Ax) se encuentra 


en Col A para todos los escalares c. 


31. a) Para polinomios arbitrarios p, q en [P, y cualquier escalar c, 


_| +0) |_| pO) + a0) 
re+0=|6720] poed 


z E + ka = T(p) +T(9) 


p(1) q(1) 
r= [20] 99] =erio 


Así, T es una transformación lineal de P, en P2. 
b) Cualquier polinomio cuadrático que se anula en 0 y 1 debe 
ser múltiplo de p(t) = 1(t — 1). El rango de T es [R?, 


33. a) Para A, B en Mx, y cualquier escalar c, 
T(A + B) =(4+ B)+(4+ By 
= A+ B+ A" +B’ Propiedad de la transpuesta 
= (A+ A7)+ (B +BT)=T(A)+T(B) 
T (cA) = (cA) + (c A)T = cA + cAT 
=c(A+ AP) =cT(A) 
Así, T es una transformación lineal de M>x>2 en M2x2. 
b) Si B es cualquier elemento en M>x2 con la propiedad 


BT = B, y si A = B, entonces, 


T(4) = 1B + (tB) =1B+1B=B 


c) El inciso b) demostró que el rango de T contiene todas 
las B tales que BT = B. Así, es suficiente demostrar 
que cualquier B en el rango de T tiene esta propiedad. 
Si B = T(A), entonces, de acuerdo con las propiedades 
de las transpuestas, 


B?” = (A+A =A" +AT =A" +A=B 
2 0 b 
d) El núcleo de T es E 0 : b real). 


35. Sugerencia: Compruebe las tres condiciones para un 
subespacio. Elementos típicos de T(U) tienen la forma 
T(u,) y T7(u>), donde u;, u> están en U. 


37. [M] w está en Col A, pero no en Nul A. (Explique por qué). 


39. [M] La forma escalonada reducida de A es 
1 0 1/3 0 10/3 


0 1 1/3 0 -26/3 
0 0 0 1  —4 
0o o0 0 0 0 
Sección 4.3, página 213 
1 1 1 
1. La matrizde3x34=| 0 1 1 | tiene tres posiciones 
0 0 1 


pivote. De acuerdo con el teorema de la matriz invertible, 
A es invertible y sus columnas forman una base para R3. 
(Véase el ejemplo 3). 


3. Este conjunto no forma una base para R?. El conjunto es 


linealmente dependiente y no genera R°. 





5. Este conjunto no forma una base para R?. El conjunto es 
linealmente dependiente porque el vector cero está en el 
conjunto. Sin embargo, 


323 0 0 1: =I 0o 0 
—3 7 0 —3j~jO 4 0 —3 
0o 0 0 5 0o 0 0 5 


La matriz tiene un pivote en cada fila y, por lo tanto, sus 
columnas generan R°. 


a 


Este conjunto no forma una base para RÌ. El conjunto es 
linealmente independiente porque un vector no es un múltiplo 
del otro. Sin embargo, los vectores no generan [R3. La matriz 


2 6 
3 —1 | puede tener a lo sumo dos pivotes ya que solo tiene 
0 5 
dos columnas. Por lo tanto, no habrá un pivote en cada fila. 
E 3 —2 
9. 1 4. |1], 0 
0 0 1 
—6 =5 ] 
13. Base para Nul A: e 5 5 
0 1 
—2 4 
Base para Col A: 2 |,| —6 
—3 8 


15. {v1, V2, V4, V5} 17. [M] {v1, V2, V3, V5} 


19. Las tres respuestas más sencillas son {v1, v2), [V1, V3) y 
{v2, V3}. Son posibles otras respuestas. 


23. Sugerencia: Utilice el teorema de matriz invertible. 
25. No. (¿Por qué el conjunto no es una base para H?). 
27. {cos œt, sen wt} 


29. Sea A la matriz de n x k [v1 = v]. Como A tiene menos 
columnas que filas, entonces no puede existir una posición 
pivote en cada fila de A. De acuerdo con el teorema 4 de la 
sección 1.4, las columnas de A no generan R” y, por lo tanto, 
no son una base para R”. 


31. Sugerencia: Si {V1,..., Vp} es linealmente dependiente, 
entonces existen c1,..., Cp, NO todos cero, tales que 
Civit + + CpVp = 0. Utilice esta ecuación. 


33. Ningún polinomio es un múltiplo del otro polinomio, de manera 
que {p1, p2} es un conjunto linealmente independiente en P3. 


35. Sea {v1, v3} cualquier conjunto linealmente independiente 
en el espacio vectorial V, y sean v2 y v4 una combinación 
lineal de vı y v3. Entonces, {v1, V3} es una base para 
Gen {vi, va, V3, v4}. 


37. [M] Hay que ser hábil para encontrar valores especiales de t 
que den varios ceros en (5), y después crear un sistema 
de ecuaciones que se pueda resolver fácilmente a mano. 
O bien, se podrían usar valores de £ tales como £ = 0, .1, .2,... 
para crear un sistema de ecuaciones que pueda resolverse 
con un programa de matrices. 
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-7 -1 

1. La] 3. | 4 5. E 7. | -1 

3 3 

1 2 

al 
1 

17. [y | 0-20 10030400 


(un número infinito de respuestas) 


19. Sugerencia: Por hipótesis, el vector cero tiene una única 
representación como una combinación lineal de elementos 
de S. 


9 2 
a [3 7 


23. Sugerencia: Suponga que [u]g = [w]g para algunas u y w 
en V, y denote las entradas en [u]g como c1,..., Cn. Utilice 
la definición de [u]g. 


25. Un posible método: Primero, demuestre que si uy,..., U, SON 
linealmente dependientes, entonces [u¡]z,..., [u,]g son lineal- 
mente dependientes. Segundo, demuestre que si [u¡]g,..., [u,]5 
son linealmente dependientes, entonces u;,..., u, son lineal- 
mente dependientes. Utilice las dos ecuaciones que se 
presentan en el ejercicio. 


27. 


29. 


31. 


33. 


35. 


Respuestas a los ejercicios con numeración impar A35 


Linealmente independiente. (Justifique las respuestas a los 
ejercicios 27 a 34). 


Linealmente dependiente. 


1 -3 —4 
a) Los vectores de coordenadas | —3 |, 51, 5l, 
5 -7 —6 
1 
O | no generan RÌ. Debido al isomorfismo entre 
—1 
R? y P3, los polinomios correspondientes no generan P3. 
0 1 -3 2 
b) Los vectores de coordenadas | 5 |,| —8 |, 4 || -3 
1 —2 2 0 
generan R?. Debido al isomorfismo entre R3 y P3, los 
polinomios correspondientes generan P3. 
3 5 0 
[M] Los vectores de coordenadas T l l 
0 | op p-—2p 
0 2 0 
1 
16 . ; ; 4 
6 [Son un subconjunto linealmente dependiente de [R*. 
2 
Debido al isomorfismo entre R4 y P}, los polinomios corres- 
pondientes forman un subconjunto linealmente dependiente 
de P; y, por lo tanto, no forman una base para P3. 
1.3 
—5/3 
[M] [xls = / 37. [M] | 0 
8/3 0.8 
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15. 


21. 


23. 


25. 


1 

1 i ; dim es 2 

0 3 

0 0 2 

1 —-1 0 ; 

0 bla ; dim es 3 

1 2 0 
1 —2 0 
2 0 5 ; 
otla b]l2 ; dim es 3 
—3 0 6 


No hay base; dim es O 9. 2 11. 3 13. 2,3 


2,3 17. 0,3 


Sugerencia: Solo se necesita demostrar que los primeros 
cuatro polinomios de Hermite son linealmente independientes. 
¿Por qué? 


[p]a = (3, 6, 2, 1) 


Sugerencia: Suponga que S genera V, y utilice el teorema 
del conjunto generador. Esto conduce a una contradicción, 
lo que demuestra que es falsa la hipótesis de generación. 


A36 Respuestas a los ejercicios con numeración impar 


27. Sugerencia: Considere el hecho de que cada P, es un 
subespacio de [P. 

29. Justifique cada respuesta: 
a) Verdadero b) Verdadero c) Verdadero 

31. Sugerencia: Como H es un subespacio diferente de cero 
de un espacio de dimensión finita, entonces H también es de 


dimensión finita y tiene una base, por ejemplo, vj,..., Vp. 
Primero demuestre que (T(v1),..., T(v,)) genera T(H). 


33. [M] a) Una base es {v1, V2, V3, €2, e3}. De hecho, cualesquiera 
dos de los vectores e2,..., €s extenderá {vV1, V2, V3} a una 
base de R5. 
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1. rango A = 2; dim Nul A = 2; 


1 —4 
Base para Col A: | —1 |, 2 
5 —6 

Base para Fil A: (1, 0, — 1, 5), (0, —2, 5, —6) 
1 -5 
Base para Nul A: a ; E 
0 1 


3. rango A = 3; dim Nul A = 3; 


>| | 6 

—2 —3 

Base para Col A: al 9 |> 
2] la] 


Base para Nul A: (2, 6, —6, 6, 3, 6), (0, 3, 0, 3, 3, 0), 


U WO U 


(0, 0, 0, 0, 3, 0) 
3 0 -3 
0 -1 0 
ase para Fl |J o | 1 |? 0 | 
0 0 0 
0 0 1 
5. 4,3,3 


7. Sí; no. Como Col A es un subespacio de dimensión 4 de R4, 
entonces coincide con R4. El espacio nulo no puede ser R?, 
porque los vectores en Nul A tienen 7 entradas. Nul A es un 
subespacio tridimensional de R7, de acuerdo con el teorema 
del rango. 


9. 3, no. Observe que las columnas de una matriz de 4 x 6 están en 


R4, más que en R3. Col A es un subespacio tridimensional de R4. 


11. 2 


13. 5, 5. En ambos casos, el número de pivotes no puede exceder 
el número de columnas o el número de filas. 


15. 4 
19. Sí. Intente escribir una explicación. 
21. No. Explique por qué. 


23. Sí. Solo se necesitan seis ecuaciones lineales homogéneas. 


25. 
27. 


29. 


31. 


33. 


35. 


37. 


No. Explique por qué. 


Fil A y Nul A están en R”; Col A y Nul 47 están en R”. 
Solo hay cuatro subespacios distintos porque Fil 47 = Col A 
y Col 47 = FilA. 


Recuerde que dim Col A = m precisamente cuando 

Col A = R” o, de manera equivalente, cuando la ecuación 
Ax = b es consistente para toda b. De acuerdo con el 
ejercicio 28b), dim Col A = m precisamente cuando 

dim Nul 47 = 0 o, de manera equivalente, cuando la 
ecuación Ax = 0 solo tiene la solución trivial. 


2a 2b 2c 
uv = | —3a -—3b -—3c |. Todas las columnas son 
5a 5b 5c 


múltiplos de u, de manera que Col uv” es unidimensional, 
a menos que a = b = c = 0. 


Sugerencia: Sea A = [u u w]. Siu % 0, entonces u 
es una base para Col A. ¿Por qué? 


[M] Sugerencia: Véase el ejercicio 28 y las observaciones 
antes del ejemplo 4. 


[M] Las matrices C y R para el ejercicio 35 funcionan aquí, 
y A = CR. 


Sección 4.7, página 242 


1. 


3. 


13. 


15. 


17. 


ela. lA 


(ii) 


-1 0 8 
a =1 1 1 b. |2 
1 -2 2 


P E l p if! | 
CB 0 -—1| BC 210 -—2 
1 3 0 5 
cg =| -2 -5 2|, 1+2t]ls = | -2 
1 4 3 1 


a) B es una base para V. 
b) El mapeo de coordenadas es una transformación lineal. 
c) El producto de una matriz y un vector. 


d) El vector de coordenadas de v respecto de B. 


a) [M] 


32 0 16 0 12 0 10 

32 0 24 0 20 0 

16 0 16 0 15 

PZA 8 0 10 0 
6 

0 

1 


4 0 
| 2 


19. 


b) cos? t = (1/2)[1 + cos 21] 
cos? 1 = (1/4)[3 cost + cos 31] 
cost t = (1/8)[3 + 4cos 2t + cos 4t] 
cos?t = (1/16)[10 cost + 5cos 3t + cos 5t] 
cost 1 = (1/32)[10 + 15cos 2t + 6cos4t + cos 6t] 


[M] Sugerencia: Sea C la base {v1, V2, v3}. Entonces las 
columnas de P son [u;]c, [u>]e y [us]e. Utilice la definición 
de vectores de C-coordenadas y álgebra matricial para 
calcular u;, u>, uz. A continuación se presentan las respuestas 
numéricas: 


—6 —6 —5 
a u=|-5|, uW=|-9]|, u= 0 
21 32 3 
28 38 21 
b) Wi = —9 » WR= —13 > W3 = —7 
—3 2 3 
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1. 


Si yg = 2%, entonces yg+1 = 24 y yaa = 2 
Al sustituir estas fórmulas en el lado izquierdo de la ecuación 


se obtiene 
Yk+2 + 2ye — Byk = 2t? +2. 2+1 — g. 2k 
= 2 (2? +2.2—8) 
=2*(0) =0 para toda k 
Puesto que la ecuación en diferencias es válida para toda k, 


entonces 2* es una solución. Un cálculo similar funciona 
para yg = (-4Y. 

Las señales 2* y (—-4)* son linealmente independientes 
porque ninguna es múltiplo de la otra. Por ejemplo, no existe 
un escalar c tal que 2* = c(-4) para toda k. De acuerdo 
con el teorema 17, el conjunto solución H de la ecuación 

en diferencias del ejercicio 1 es bidimensional. De acuerdo 
con el teorema de la base de la sección 4.5, las dos señales 
linealmente independientes 2* y (-4)* forman una base 

para H. 


Si y; = (-2*, entonces 


Yet + Aya + dy = (Y 4 42 + (2) 
= 62) + 42) + 4] 
= (-2)(0) =0 para toda k 
De manera similar, si y, = k(-2)*, entonces 
Yk+2 + 4yk+1 + 4yk 
= (k +22 4 4(k + D)(=2) +! + 4k(=2)* 
= (2 (k + 222? + 4(k + 1)(22) + 4k] 
= (2) [4k + 8 — 8k — 8 + 4k] 
= (—2)* (0) para toda k 
Así, (—2)* y k(—2¥ están en el espacio solución H de la 
ecuación en diferencias. Además, no existe escalar c tal que 
k(-2* = c(-2) para toda k, porque c se debe seleccionar 
independientemente de k. De igual manera, no existe un 


escalar c tal que (-2)* = ck(-2)* para toda k. Así, ambas 
señales son linealmente independientes. Como dim A = 2, 


11. 


13. 
17. 
19. 
21. 


23. 
25. 
29. 


31. 


33. 


35. 


37. 


Respuestas a los ejercicios con numeración impar A37 


entonces las señales forman una base para H, de acuerdo con el 
teorema de la base. 


Sí 9. Sí 


No, dos señales no pueden generar el espacio solución 
tridimensional. 


ko park 
(6) G) IN 
Y, =c1(.8) + c,(.5)* + 10 > 10 conforme k > 00 
Y =0 (24 13) + co (2— V3} 
7,5, 4,3, 4,5, 6, 6, 7, 8, 9, 8, 7; véase la figura: 


10) = datos originales 


84 = datos suavizados 
6+ 
4+ 
2: ARS 








H H + H H H }k 


0 2 4 6 8 10 12 14 


a) yk+ı — 1.01yp = —450, yo = 10,000 
kta CA teo 27. -2+k+c,-2 +<c>- (2) 


X+1 = Axz, donde 


0. 1.0 y Yk 
_¡p0 0 1 0 — | Yk+ı 
Aa o o a o 5] n 
E E del 


La ecuación es válida para toda k, así que esta vale para k — 1 
en lugar de k, lo que transforma la ecuación en 


Yk+2 + 5yk+1 + 6y =O para toda k 


La ecuación es de orden 2. 


Para toda k, la matriz de Casorati C(k) no es invertible. 

En este caso, la matriz de Casorati no da información acerca 
de la independencia o dependencia lineal del conjunto de 
señales. De hecho, ninguna señal es un múltiplo de la otra, 
así que son linealmente independientes. 


Sugerencia: Compruebe las dos propiedades que definen 
una transformación lineal. Para {yg} y {zg} en S, estudie 
T({yk} + {zk}). Observe que si r es cualquier escalar, 
entonces el k-ésimo término de r[ y¿) es ryz; así, TlrLy)) 
es la secuencia (wz) dada por 


Wk = FYk+2 + a(ryk+1) + b(ryk) 
Sugerencia: Encuentre TD(yo, y1, 2...) y DT(Oo, y 1) Y2»---). 
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. a) De: b) A c) 33% 
N M A: 
.7 .6| Noticias 
E Al Música 
a) De b) 15%, 12.5% 
H I A 


Sano 


95 6.45 
.05  .55| Enfermo 


A38 Respuestas a los ejercicios con numeración impar 


c) .925; utilice xp = A 


1/4 
5/14 
5. Pa 7. a 


9. Sí, porque todas las entradas de P? son positivas. 


11. a) Ea b) 2/3 


13. a) E 


15. [M] Aproximadamente el 13.9% de la población de Estados 
Unidos. 


b) .10, no 


17. a) Las entradas en una columna de P suman 1. Una columna 


en la matriz P — I tiene las mismas entradas que en P 
excepto que una de las entradas ha disminuido en 1. 
Por lo tanto, la suma de cada columna es 0. 

b) De acuerdo con el inciso a), la fila inferior de P — T es el 
negativo de la suma de las otras filas. 

c) Según el inciso b) y el teorema del conjunto generador, 
la fila inferior de P — I se puede eliminar y las restantes 
(n — 1) filas continuarán generando el espacio fila. 
De forma alternativa, utilice el inciso a) y considere el 
hecho de que las operaciones fila no cambian el espacio 
fila. Sea A la matriz obtenida de P — I sumando la fila 
inferior a todas las demás filas. Según el inciso a), el 
espacio fila se genera por las primeras (n — 1) filas de A. 

d) De acuerdo con el teorema del rango y el inciso c), la 


dimensión del espacio columna de P — I es menor que n, 


y así el espacio nulo es no trivial. En vez del teorema del 


rango, se puede recurrir al teorema de la matriz invertida, 


ya que P — I es una matriz cuadrada. 


19. a) El producto Sx es igual a la suma de las entradas en x. 

Para un vector de probabilidad, esta suma debe ser 1. 

b) P = [Pi P2" Phn], donde las p; son vectores de 
probabilidad. Mediante la multiplicación matricial 
y el inciso a), 
SP =|[Sp, Sp, Sp,] =[1 1 1] =S 

c) Por el inciso b), S(Px) = (SP)x = Sx = 1. También, 
las entradas en Px son no negativas (porque P y x tienen 


entradas no negativas). Así, por el inciso a), Px es un 
vector de probabilidad. 
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1. a) V b) V c) F d) F ev DY 
g) F h) F i V jF k) F D) F 
m) V n) F o) V p) V q) F r) V 
s) V t) F 


3. El conjunto de todas las (b1, b2, b3) que satisfacen 
bı + 2b, + b3 = 0. 


5. El vector pı no es cero y pz no es un múltiplo de pı, de ma- 
nera que conserve ambos vectores. Como p3 = 2p1 + 2p», 
elimine p3. Ya que pa tiene un término ¢°, no puede ser 
una combinación lineal de p¡ y p», entonces conserve pa. 
Finalmente, p; = p¡ + Pa, entonces elimine ps. 

La base resultante es [p;, P», Pa). 


12. 


13. 


15. 


17. 


19. 


21. 


Se debería saber que el conjunto solución del sistema 
homogéneo se genera con dos soluciones. En este caso, 

el espacio nulo de la matriz de coeficientes A de 18 x 20, 
a lo sumo, es bidimensional. De acuerdo con el teorema 
del rango, dim Col A = 20 — 2 = 18, lo que significa que 
Col A = [R'S, porque A tiene 18 filas, y cada ecuación 

Ax = b es consistente. 


Sea A la matriz estándar de m x n de la transformación T. 


a) Si Tes uno a uno, entonces las columnas de A son 
linealmente independientes (teorema 12 de la sección 1.9), 
por lo que dim Nul A = 0. De acuerdo con el teorema del 
rango, dim Col A = rango A = n. Como el rango de T es 
Col A, la dimensión del rango de T es n. 


b) Si T es sobre, entonces las columnas de A generan R” 
(teorema 12 de la sección 1.9), de manera 
que dim Col A = m. Según el teorema del rango, 
dim Nul A = n — dim Col A = n — m. Como el 
núcleo de T es Nul A, la dimensión del núcleo de 
Tesn —m. 


Si S es un conjunto generador finito para V, entonces 

un subconjunto de S (por ejemplo, S’) es una base para V. 
Como S” debe generar a V, S” no puede ser un subconjunto 
propio de $ debido a la minimalidad de S. Por lo tanto, 

S' = S, lo que demuestra que S es una base para V. 


a) Sugerencia: Cualquier y en Col AB tiene la forma y = ABx 
para alguna x. 


De acuerdo con el ejercicio 9, rango PA <= rango A, 
y rango A = rango P”'PA <= rango PA. Por lo tanto, 
rango PA = rango A. 


La ecuación AB = 0 indica que cada columna de B está 

en Nul A. Como Nul A es un subespacio, entonces todas 

las combinaciones lineales de las columnas de B están en 

Nul A, de manera que Col B es un subespacio de Nul A. Según 
el teorema 11 de la sección 4.5, dim Col B < dim Nul A. 

Al aplicar el teorema del rango, se encuentra que 


N = rango A + dim Nul A = rango A + rango B 


a) Suponga que A; consiste en las r columnas pivote en A. 
Las columnas de A; son linealmente independientes. 
Así, A, es una submatriz de m x r con rango r. 


b) De acuerdo con el teorema del rango aplicado a A4, 
la dimensión de Fil A es r, de manera que Aj tiene r 
filas linealmente independientes. Utilícelas para formar 
A2. Entonces, Az es de r x r con filas linealmente 
independientes. Según el teorema de la matriz invertida, 
A) es invertible. 


0. 1 0 

[B AB 4A?B]=| 1 -.9 .81 
1 2.5 25 

1 —.9 8I 

=|0 1 0 

0 0 —.56 


Esta matriz tiene rango 3, así que el par (A, B) es controlable. 


[M] rango [B AB AB AB] = 3.El par (A, B) no es 
controlable. 


Capítulo 5 


Sección 5.1, página 271 


13. 


15. 


19. 


23. 


25. 


27. 


29. 


31. 


33. 


35. 


37. 


Sí 3. Sí,A= -2 5. Sí, A= -—3 
1 
Sí, 1 
-1 
0 1 
fits (E 
3 -1 
pal ke 
0 -1 — 
A=1 105 1d =2 21; 4=3 
0 2 1 
— -1 
> 0 17. 0,3,-2 
1 


O. Justifique su respuesta. 
Sugerencia: Aplique el teorema 2. 


Sugerencia: Utilice la ecuación Ax = Ax para encontrar una 
ecuación que implique a 47?. 


Sugerencia: Para cualquier A, (A — AY =A7 — AM. 
De acuerdo con un teorema (¿cuál?), AT — Al es invertible 
si y solo si A — ÀJ es invertible. 


Sea v el vector en R” con todas sus entradas igual a 1. 
Entonces, Av = sv. 


Sugerencia: Si A es la matriz estándar de T, busque un vector v 


diferente de cero (un punto en el plano) tal que Av = v. 
a) Xx = Attu + caut t'v 


b) Ax, = A(c¡ Au + cal y) 

=c¡A Au + cout Av Linealidad 
cià àu + cop* uv 
= Xk+41 


u y v son vectores propios. 


xX 


2 Tw) 
T(v) 





—1 —3 2 
[MM] à =5: | —1 |; à= 10: 21; A=15: 
2 1 1 


Respuestas a los ejercicios con numeración impar 


0 
1 

39. [M] à = —4: | 2 |; 
0 
1 


> 

II 

l 

o0 
ON UYUuU On 
Rrornoo 


Sección 5.2, página 279 
1. 12-41-45;9,-5 
5. 12-161 +48; 4, 12 


3. 12-32 —40; -5, 8 


7. 12— 91 + 32; ningún valor propio real 
9. —1% + 101? — 334 + 36 
13. —41* + 181? — 952 + 150 

17. 3,3,1,1,0 


157: 23,949 


19. Sugerencia: La ecuación dada es válida para toda A. 


23. Sugerencia: Encuentre una matriz invertible P tal que 
RO = PAP. 


25. a) (vi, v2), donde v, = | -= | es un vector propio para 
A=.3 
b) Xo = vi — a Vo 
c) xı = Vi — £(3)v2,x2 = v1 — 4(3)w, y 
Xp =V1= (3 >. Ask > 00, (.3)* > 0 y 


Xi > V1. 


11. —1? + 84? — 19A + 12 


A39 


27. a) Avı = V1, ÁV = .5Vv2, ÁV3 = .2v3 (Esto también muestra 


que los valores propios de A son 1, .5 y .2). 


b) (vi, va, v3) es linealmente independiente porque los 


c) 


vectores propios corresponden a distintos valores propios 
(teorema 2). Como hay 3 vectores en el conjunto, entonces 
el conjunto es una base para [R3. Así, existen constantes 
(únicas) tales que 

Xy = C1V1 + C2V2 + C3V3 

Entonces, 


WXo = c¡Wly¡ + cawlv) + c3w!vs =) 


Como xo y vı son vectores de probabilidad y puesto 
que las entradas en v2 y en v3 suman 0, (*) indica que 
1 = Cik 


De acuerdo con el inciso b), 
Xo = V1 + C2V2 + C3V3 


Con base en el inciso a), 

Xx = Ax, = Atv, +c,4fv) + c3 A*vV3 
= v + cl. + a(.2) vz 
> v¡ como k > 0 


A40 Respuestas a los ejercicios con numeración impar 


29. [MI] Informe sus resultados y conclusiones. 
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1. 


Cuando una respuesta implica una diagonalización, A = PDP”?, 
los factores P y D no son únicos, de manera que su respuesta tal 


226 -525 3 ak 0 
90 —209 * | 2(až =b) b 


—1 1 0 
E VER: 1]; 4=3:| —1 |,| —1 
—1 0 


vez difiera de la que aquí se presenta. 


s PA 


No es diagonalizable 


1 -1 -1 5 0 0 
14. P=|2 1 0j|,D=|0 -1 0 
3 0 1 0 0 -l 
-1 1 5 0 0 
13 P=|-1 -1 0|,)D=|0 1 0 
1 1 0 0 1 
=1 -1 -1 0 0 
15. P= 1 1 .D=|0 1 0 
-1 0 1 0 1 
17. No es diagonalizable 
1 3 -1 -1 5 0 0 0 
0 2-1 2 0o 3 0 0 
Bpa 0 0 1 0p D= 0 0 2 0 
0o 0 0 1 0o 0 0 2 

23. Sí. (Explique por qué). 

25. No, A debe ser diagonalizable. (Explique por qué). 

27. Sugerencia: Escriba A = PDP”!, Como A es invertible, 
0 no es un valor propio de A, de manera que D tiene 
entradas diferentes de cero sobre su diagonal. 

29. Una respuesta es P, = | 2 _1 | cuyas columnas 
son vectores propios correspondientes a los valores 
propios en Dj. 

31. Sugerencia: Construya una adecuada matriz triangular 
de 2 x 2. 

2 0 -l 1 

7 —1 0 —4 

M= 7 0O 2 Ọ0 
0. 1 0 3 

—12 0 0 0 
0-12 0 0 

D=| oò on o 
0 0 0 13 


2 1-3 1 0 
1 0 0O 1 0 
35. [MP=|0 1 0 0 -1|, 
0o 1 0 de 0 
o 0 2 0 1 
7 0 0 0 0 
07 0 0 0 
D=|0 0 7 0 0 
0 0 0-14 0 
0 0 o0 dm] 
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3-1 0 
t. E 6 {l 


3. a) T (e1) = b3, T (e2) = —b; = 2b,, T (e3) = 2b; + 3b3 


0 —-1 
b) [Tte], =| 0 |.[T(0)1,=| -2 |. 
1 0 
2 
[T(es)], =| 0 
3 
0 —1 2 
c)| 0 -2 0 
1 0 3 


5. a 9-3+P+P 


b) Para cualesquiera p, q en P, y cualquier escalar c, 


TIPO +46) = t +3) + qíe)] 
= (1 +3)p(0) + (1 + 3)g(c) 
= TPO] + Tla(o)] 
Tlc-p(t)] = (+ + 3)[c -p(t)] = c- (t + 3)p(2) 
=c- TPO] 


h 
Oh. wo 
RR uwOoo 


9. a |5 


b) Sugerencia: Calcule T(p + q) y T(c : p) para p, q 
arbitrarios en [P, y cualquier escalar c. 


1 —-1 1 
c)| 1 0 0 
1 1 1 


17. a) Ab, = 3b;, por lo que b; es un vector propio de A. 
Sin embargo, A solo tiene un valor propio, A = 3, 
y el espacio propio es unidimensional, por lo que A 
no es diagonalizable. 


nfa 3] 


19. Por definición, Si A es semejante a B, existe una matriz 
invertible P tal que P7!AP = B. (Véase la sección 5.2). 
Entonces, B es invertible porque es el producto de matrices 
invertibles. Utilice la ecuación P7!AP = B para demostrar 
que A”! es semejante a B”!. 


21. Sugerencia: Revise el problema de práctica 2. 
23. Sugerencia: Calcule B(P7*x). 


25. Sugerencia: Escriba A = PBP"! = (PB)P”!, y utilice la 
propiedad de la traza. 


27. Para cada j, I(b;) = b;. Como el vector de coordenadas 
estándar de cualquier vector en R” es justamente el vector 
mismo, entonces [/(b;)]e = bj. Por lo tanto, la matriz para 
I respecto de B y a la base estándar € es simplemente 
[bi  b> --* b,]. Esta matriz es precisamente la matriz de 
cambio de coordenadas Pg definida en la sección 4.4. 


29. La matriz B para la transformación identidad es /,,, porque 
el vector de B-coordenadas del ¡-ésimo vector base by es la 
¡-ésima columna de /,,. 


-7 -2 —6 
31. [M]| 0 -4 -6 
0 0 -i 
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1. ea 4=2-5,| 


=1—i 
1 


= A yal 
3. 1=3+2,| 4 | | 4 | 


Sowa T e a or a LET 
5. 1=4+1,| ; | amai] j | 


7. à = V3 +i, = x/6 radián, r = 2 
9. à = +2i, ọ = —r /2 radianes, r = 2 
11. à = -v73 i, = —5xr/6 radián, r = 2 


En los ejercicios 13 a 20, son posibles otras respuestas. Cualquier 
P que haga P7!AP igual a Co a C7 es una respuesta satisfactoria. 


Primero, encuentre P; después, calcule PIAP. 
-1 -—1 2 -1 

13. -| i eel J 

3 1 1 3 

0 | GS | —3 1 | 


15. P = 


19. P= 


n -| 


21. 


23. 


25. 


27. 


Respuestas a los ejercicios con numeración impar A41 


mí 2 _>l+2i =a 
L= e 5 


a) Propiedades de conjugados y el hecho de que X” = x7. 


b) Ax = AX y A es real; c) porque x” AX es un escalar y 
entonces puede considerarse como una matriz de 1 x 1; 
d) propiedades de transpuestas; e) AT = A, definición de q. 


Sugerencia: Primero escriba x = Re x + i (Im x). 
-1 1 -1 -1 


sal E mr 


0 0-10 —4 


Son posibles otras elecciones, pero C debe ser igual a PAP. 


Sección 5.6, página 309 


1. 


13. 


a) Sugerencia: Encuentre cy, cz tales que Xy = C¡V¡ + C2V2. 
Utilice esta representación y considere el hecho de que vı 


49/3 l 


y v2 son vectores propios de A para calcular x; = | 41/3 


b) En general, x; = 5(3)*v, — Av para k = 0. 
Cuando p = .2, los valores propios de A son .9 y .7, y 
Xk = aco] r | + ca(.7) | a > 0 conforme k> 00 


La elevada tasa de depredación reduce el abastecimiento 
de comida de los búhos y, con el tiempo, perecen ambas 
poblaciones: presas y depredadores. 


Si p = .325, los valores propios son 1.05 y .55. Como 
1.05 > 1, ambas poblaciones crecerán en un 5% anual. 
Un vector propio para 1.05 es (6, 13), de manera que, con 
el tiempo, habrá aproximadamente 6 búhos manchados 
por cada 13 (mil) ardillas voladoras. 


a) El origen es un punto silla porque A tiene un valor 
propio más grande que 1 y uno más pequeño que 1 
(en valor absoluto). 


b) La dirección de más fuerte atracción está dada por el vector 
propio correspondiente al valor propio 1/3, a saber, va. 
Todos los vectores que son múltiplos de v, son atraídos 
hacia el origen. La dirección de mayor repulsión está 
dada por el vector propio vı. Todos los múltiplos de vı 
se repelen. 


Punto silla; valores propios: 2, .5; dirección de mayor 
repulsión: la recta a través de (0, 0) y (— 1, 1); dirección de 
mayor atracción: la recta por (0, 0) y (1, 4). 


. Atractor; valores propios: .9, .8; mayor atracción: recta que 


pasa por (0, 0) y (5, 4). 


Repulsor; valores propios: 1.2, 1.1; mayor repulsión: recta 
que pasa por (0, 0) y (3, 4). 


A42 Respuestas a los ejercicios con numeración impar 


15. 


17. 


2 -1 
x=w +5] -3|+.362] 0|>v 
1 1 


conforme k > 00 


o 16 
Ei È e 


b) La población está creciendo porque el mayor valor 
propio de A es 1.2, que es más grande que 1 en magnitud. 
La tasa de crecimiento final es 1.2, que es del 20% anual. 
El vector propio (4, 3) para A; = 1.2 indica que habrá 
4 juveniles por cada 3 adultas. 


c) [M] La razón entre juveniles y adultas parece estabilizarse 
después de 5 o 6 años. 
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pa 


11. 


x(t) = sie — T Ja 


a Fale =I [e~ Elon to sill 
> 1 > 1 > origen es un punto sı a. 


La dirección de mayor atracción es la recta que pasa por 
(- 1, 1) y el origen. La dirección de mayor repulsión es la 
recta que pasa por (—3, 1) y por el origen. 


213 211 
La dirección de mayor repulsión es la recta que pasa por 
(1, 1) y por el origen. 


1 1 4 0 
Sean P = |; l D = $ o| Entonces, 


A = PDP”!. Al sustituir x = Py en x' = Ax, se tiene 


d 
ger 54e 
Py = PDP—!(Py) = PDy 


Multiplicando por la izquierda por P”! resulta 


HD Ea J 
ya(0) 0 6]|y() 


(solución compleja): 
E | 1 > | ¿4D 4 e, | 1 E i | ¿in 


(solución real): 


cosí + sent = senź — cos t = 
c + eT% + Co e A 
cost sení 


1 7 
-3| l je +> | . jes. El origen es un repulsor. 


Las trayectorias caen en espiral hacia el origen. 


(compleja): cı k x | e te DE J dd | e 


(real): 


—3 cos 31 — 3sen31 —3sen31 + 3 cos 31 
l 2 cos 3t E 2sen31 


Las trayectorias son elipses alrededor del origen. 


13. 


15. 


17. 


19. 


21. 


(compleja): cy | l 7 l | e (+3 y e, | 1 T | e0—3i)t 


2 cos 3t 2sen3t 


(real): cı be 31 —sen31 | iig W + cos 31 | ; 


Las trayectorias son espirales que se alejan del origen. 

-1 —6 —4 
0 le” +o] 1letr+c| 1le 
1 5 4 


[M] x(t) = cı 


El origen es un punto silla. Una solución con c3 = 0 es 
atraída hacia el origen. Una solución con cı = c2 = 0 
es repelida. 


[M] (compleja): 


=3 23 — 34i 

al 1Llẹe+eo| —9+14i |e6tt 4 
1 3 

23 + 34i 

c3 | —9— 14i | e672! 
3 
—3 23 cos 2t + 34sen2t 
(real): cı 1 |e! +c | —9cos2t — l4sen2t |e% + 
3 cos2t 


23sen2t — 34 cos 2t 
c3 | —9sen2t + 14cos2t | e” 
3sen2t 


El origen es un repulsor. Las trayectorias son espirales hacia 
afuera, alejándose del origen. 


Pa BA 
mm a= 7 A 


A MES O 
mojo [je 
mas |; al 


i(t) | _ —20sen 6t ¿3 
vc lt) 15cos 6f — 5sen6t 
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1. 


> 


1 4.9978 
Vector propio: X4 = 3326 o Ax, = 1.6652 


À = 4.9978 


> 


Vector propio: X4 = ej | o ÁAXy = | 


.4594 
1 


.9075 
A =.9075 


¿IN ay | 40015], 
=| 1 PT | -5.0020 | 


à estimada = — 5.0020 


[M] 

PAES 1 .9932 1 .9998 
k | 1 |]. .9565 |” 1 [° | .9990 |’ 1 

uk: 11.5, 12.78, 12.96, 12.9948, 12.9990 

[M] u5; = 8.4233, us = 8.4246; valor real: 8.42443 


(con 5 lugares de precisión) 


11. 


13. 
15. 


17. 


19. 


21. 


px: 5.8000, 5.9655, 5.9942, 5.9990 (k = 1,2,3,4); 
R(xx): 5.9655, 5.9990, 5.99997, 5.9999993 


Sí, pero las secuencias pueden tener lenta convergencia. 


Sugerencia: Escriba Ax — a:x = (A — al )x, y considere 
el hecho de que (A — al) es invertible cuando « no es un 
valor propio de A. 


[M] vo = 3.3384, vı = 3.32119 (con 4 lugares de precisión 
con redondeo), v2 = 3.3212209. Valor real: 3.3212201 
(con 7 lugares de precisión) 


[M] a) us = 30.2887 = u3 con cuatro cifras decimales. 
Con seis lugares, el mayor valor propio es 
(.957629, .688937, 1, .943782). 


b) El método de potencias inverso (con œ = 0) produce 
1! = .010141, u3 ' = .010150. Con siete lugares, 
el menor valor propio es 0.0101500, con vector propio 
(—.603972, 1, —.251135, .148953). La razón de la 
convergencia rápida es que el siguiente valor propio 
más pequeño (segundo en tamaño) está cerca de .85. 


a) Si todos los valores propios de A son menores que 1 en 
magnitud, y si x + 0, entonces A*x es aproximadamente 
un vector propio para k grande. 


b) Si el valor propio estrictamente dominante es 1, y si x 
tiene una componente en la dirección del vector propio 
correspondiente, entonces [A*x) convergerá a un múltiplo 
de ese vector propio. 


c) Si todos los valores propios de A son mayores que 1 en 
magnitud, y si x no es un vector propio, entonces la 


distancia de A*x al vector propio más cercano se 17. 


incrementará conforme k > oo, 


Capítulo 5 Ejercicios complementarios, página 326 


1. 





a) V b) F c) V d) F ev fv 
g) F h) V i) F DV k) F 1) F 
m) F n) V 0) F p) V q) F r) V 
s) F t) V u) V v) V w) F x) V 
a) Suponga que Ax = Ax, con x + 0. Entonces, 

(5I — A)x = 5x — Ax = 5x — Àx = (5 — À)x. 

El valor propio es 5 — À. 
b) (5I — 3A + 4?)x = 5x— 3Ax + A(Ax) 

= 5x— 34x + 1%x 19. 


= (5-34 +42)x. 
El valor propio es 5 — 3A + 22. 


Suponga que Ax = Ax, con x + 0. Entonces, 
p(A)x = (col + c1 A + c24? +--+ + cn A”)X 
= CoX + C1 ÁX + C2 A?X +--+ + C, A"X 
= CoX + C1ÀAX + C2A?xX + -++ + ch A”x = p(À)x 


Así, p(A) es un valor propio de la matriz p(4). 


Si A = PDP”?, entonces p(A) = Pp(D)P™}, como se 
muestra en el ejercicio 6. Si la entrada (j, j) en D es À, 
entonces la entrada (j, j) en Dl es A, de manera que 

la entrada (7, /) en p(D) es p(A). Si p es el polinomio 
característico de A, entonces p(A) = O para cada entrada 


11. 


13. 
15. 


21. 


Respuestas a los ejercicios con numeración impar A43 


diagonal de D, porque las entradas en D son los valores 
propios de A. Por lo tanto, p(D) es la matriz cero. 
Así, p(4) =P:0-P7!=0, 


Si I — A no fuera invertible, entonces la ecuación 

(I — AJx = 0 tendría una solución no trivial. Por lo tanto, 
xXx — Ax =0 y Ax = 1-x, lo que muestra que A tendría 1 
como un valor propio. Esto no puede suceder si todos los 
valores propios son menores que 1 en magnitud. Así que 
I — A debe ser invertible. 


a) Tome x en H. Entonces, x = cu para algún escalar c. 

Así, Ax = A(cu) = c(4u) = c(2u) = (cA)u, lo que 
muestra que Ax está en H. 

b) Sea x un vector diferente de cero en K. Como K es 
unidimensional, entonces K debe ser el conjunto de todos 
los múltiplos escalares de x. Si K es invariante bajo A, 
entonces Ax está en K y, por lo tanto, Ax es un múltiplo 
de x. Por consiguiente, x es un vector propio de A. 


1,3, 7 


Sustituya a por a — A en la fórmula del determinante del 
ejercicio complementario 16 del capítulo 3: 


det(A—A1)=(a—b-Ay=a—A-+(n— 1)b] 


Este determinante es cero solo sia — b — A = 00 

a — à + (n — 1)b = 0. Así, À es un valor propio de A 

si y solo si à =a — boà =a + (n — 1)b. De la fórmula 
anterior para det(A — AZ), la multiplicidad algebraica es 
n — l paraa — b y l paraa + (n — 1)b. 


det(A AI) = (a11 2) (az À) 
22 — (an +ax2)à + (ananz — 412471) = 


22 — (tr 4)2 + det A. Utilice la fórmula cuadrática para 
resolver la ecuación característica 


q tr A + y (tr 4)? — 4 det A 
o 2 





412421 = 


Ambos valores propios son reales si y solo si el 
discriminante es no negativo, es decir, (tr A)? — 4 det A = 0. 
Esta desigualdad se simplifica a (tr 4)? = 4 det A 


tr Ay? 
(5) > det A. 


C, = E 5 fec -an =6- 5+2? = på) 
Si p es un polinomio de orden 2, entonces un cálculo 

tal como el del ejercicio 19 muestra que el polinomio 
característico de C, es p(À) = (— 1) p(A), de manera que 

el resultado es verdadero para n = 2. Suponga que el 
resultado es válido para n = k para alguna k = 2, y considere 
un polinomio p de grado k + 1. Entonces, al desarrollar 
det(C, — Al) por cofactores en la primera columna, 

el determinante de C, — Al es igual a 


=X 1 ds 0 


(A) det + (-DFa 


41 —42 —ak— À 
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23. 


25. 


La matriz de k x k que se muestra es C¿ — Al, donde 
q(t) =a +a2t +-+ apt! + t*. Porla suposición de 
inducción, el determinante de C} — A es (— 1)Ž4(A). Así, 


det(C, — 11) = D)Hay + (A) ED) 
= (=D'+Hao + A (a o. + apa! £ A] 
= (DH pA) 


Entonces la fórmula es válida para n = k + 1 cuando es 
verdadera para n = k. Por el principio de inducción, la fórmula 
para det(C, — AI) es correcta para toda n = 2. 


Del ejercicio 22, las columnas de la matriz de Vandermonde 

V son vectores propios de C,, que corresponden a los valores 
propios A, Az, Az (las raíces del polinomio p). Como esos 
valores propios son distintos, los vectores propios forman 

un conjunto linealmente independiente, de acuerdo con el 
teorema 2 de la sección 5.1. Así, V tiene columnas linealmente 
independientes y, por lo tanto, es invertible, según el teorema 
de la matriz invertible. Por último, como las columnas de V 
son vectores propios de C,, el teorema de diagonalización 
(teorema 5 de la sección 5.3) indica que V”!C,V es diagonal. 


[M] Si su programa de matrices calcula valores propios 

y vectores propios mediante métodos iterativos en vez de 
utilizar cálculos simbólicos, podría tener algunas dificultades. 
Encontrará que AP — PD tiene entradas extremadamente 
pequeñas y que PDP”*! es muy cercana a la matriz A. 

(Esto sucedía hasta hace pocos años, pero la situación 

podría cambiar conforme mejoren los programas de matrices). 
Si P se construye con los vectores propios del programa, 
entonces compruebe el número de condición de P. Esto puede 
indicar que en realidad no se tienen tres vectores propios 
linealmente independientes. 


Capítulo 6 


Sección 6.1, página 336 


13. 


21. 


23. 


25. 


27. 


29. 


3/35 
5,8, 3. | -1/35 5. | al 
5 1/7 12/13 
, 7/1/69 
v35 9. E 1. | 2/69 


4/469 
54/5 


15. No son ortogonales 17. Ortogonales 
Sugerencia: Utilice los teoremas 2 y 3 de la sección 2.1. 


u-v = 0, ||ul]? = 30, [| v]? = 101, 
lu + vli? = (25? + (29? + 52 = 131 =30+ 101 


El conjunto de todos los múltiplos de | ES | (cuando v + 0) 


Sugerencia: Aplique la definición de ortogonalidad. 


Sugerencia: Considere un vector típico w = c1V1 + + + CpVp 
en W. 


31. 


33. 


Sugerencia: Si x está en WŁ, entonces x es ortogonal a todo 
vector en W. 


[M] Establezca su suposición y compruébela algebraicamente. 


Sección 6.2, página 344 


1. 
7. 


11. 


15. 


17. 


19. 
25. 


27. 


29. 


31. 


33. 


No son ortogonales 3. No son ortogonales 5. Ortogonales 


Demuestre que u¡-u2 = O, mencione el teorema 4, y observe 
que dos vectores linealmente independientes en R? forman 
una base. Después obtenga 


=$ 3]+8[5] | 3)+45] 


Demuestre que u-u? = 0, u¡-uz = 0, y u»uz = 0. Mencione 
el teorema 4, y observe que tres vectores linealmente 
independientes en R? forman una base. Después obtenga 


x= uy — Zu, + Lu, = žu = im + 2u; 
E _|-4/5 14/5 
er las) 
E 6 E : 
y-ĵ= | shi distancia es 1 


1/43] [ -1/72 
1/43 |, 0 
1/43 1/42 


Ortonormales 21. Ortonormales 


Sugerencia: ||Ux||? = (Ux)" (Ux). Además, los incisos a) y c) 
se deducen de b). 


Sugerencia: Se necesitan dos teoremas, uno de los cuales 
solamente se aplica a matrices cuadradas. 


Sugerencia: Si se tiene un candidato para una inversa, 
es posible revisar si el candidato funciona. 


Suponga que Y = ray, Remplace u por cu con c + 0; 
u-u 
entonces, 


y: (cu) 


cnn (01% 





_ c(y-u) 
(cu) cu-u 


Sea L = Gen {u}, donde u es diferente de cero, y 
T(x) = proyz Xx. Por definición, 


T(x) = “u = (x-u)(u-u) tu 


Para x y y en R” y cualesquiera escalares c y d, las propiedades 
del producto interior (teorema 1) indican que 


T (cx + dy) = [(cx + dy)-u](u-u) lu 

[c(x-u) + d(y-u)](u-u) tu 
c(x-u)(u-u) tu + d(y-u) (u-u) tu 
=cT(x)+dT(y) 


Por lo tanto, T es lineal. 
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0 10 
—2 —6 
Lo x= 501 — 5024 3054204 x= | 4 |+|_, 
—2 2 
—1 —1 
3| 4 5. 2y 
0 6 
10/3 -7/3 a S 
zys ala 713] 9oy=|L+|7 
8/3 7/3 K A 
3 -1 
-1 =3 
e a 15. /20 
-1 3 


8/9 -2/9 2/9 
2/9 5/9 4/9 


17. a) UTU = È y uuz = 
2/9 4/9 5/9 


2 2 
b) proyw y = 6u: + 3w = | 4 |, (UUT)y = | 4 
5 a 
0 0 
19. Cualquier múltiplo de | 2/5 |, tal como| 2 |. 
1/5 1 


23. Sugerencia: Utilice el teorema 3 y el teorema de 
descomposición ortogonal. Para la unicidad, suponga 
que Ap = b y Ap; = b, y considere las ecuaciones 


Pp=p.+(p-p)yp=p+0. 
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a pel 
de lod 5 3. EE , | 3/2 
zj 2 1 3/2 


5 
; i 7. | —5/4730 |,| 1/76 
1 1/4/4301 L 1/46 


1 
-1 
11. | —1 
1 
1 


bo 
NS 


e 
2/1/30 n 

| 

lA 


15. 


19. 


21. 


23. 


25. 
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1/ V5 1/2 1/2 
1/45 0 0 
O=|-1/45 1/2 1/21, 
1/ v5 -1/2 Nel 
1/ V5 1/2 -1/2 


V5 -v5 4v5 
R= 0 6 —2 
0 0 4 


Suponga que x satisface Rx = 0; entonces, ORx = Q0 = 0, 
y Ax = 0. Como las columnas de A son linealmente 
independientes, x debe ser cero. A la vez, este hecho indica 
que las columnas de R son linealmente independientes. 
Como R es cuadrada, entonces es invertible, de acuerdo con 
el teorema de la matriz invertible. 


Denote las columnas de Q como q1,..., qn. Observe que 

n = m, porque Á es de m x n y tiene columnas linealmente 
independientes. Considere el hecho de que las columnas 
de Q pueden ampliarse a una base ortonormal para R”, 
por ejemplo, [Q1,..., qm). (La Guía de estudio describe 


un método). Sea Qo =[4,, +1 4n1y01=[Q Qol. 
Entonces, al utilizar la multiplicación matricial particionada, 


R 
of o] = QR = A. 
Sugerencia: Particione R como una matriz por bloques 


de 2 x 2. 


[M] Las entradas diagonales de R son 20, 6, 10.3923 y 7.0711, 
con cuatro cifras decimales. 
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ra 


11. 


13. 


15. 


9 allalla] 2i] 


6 6x] f6 ~ f 4⁄3 
ofk alal=[-s] »*-[45] 
5 —1 
=| 3 |4+x| 1 7. 2/5 
0 1 
1 
Ao A 2/7 
Ji | neja] 
0 
i 2/3 
a) b = 4 b) R= 0 
4 1/3 
11 7 
Au=|-11 |, Av=|-12|, 
11 7 
0 4 
b— Au = 21 b-A4Av= 3 |. No, u posiblemente 


no podría ser solución de mínimos cuadrados de Ax = b. 
¿Por qué? 


[i 


A46 Respuestas a los ejercicios con numeración impar 


19. a) Si Ax = 0, entonces ATAx = A70 = 0. Esto muestra que 
Nul A está contenido en Nul ATA. 
b) Si ATAx = 0, entonces x7A7A x = x70 = 0. 
Así, (AX)T(Ax) = 0 (lo que significa que ||Ax|[? = 0), 
y por lo tanto, Ax = 0. Esto muestra que Nul ATA 
está contenido en Nul A. 


21. Sugerencia: Para el inciso a), utilice un importante teorema 
del capítulo 2. 


23. De acuerdo con el teorema 14, b = 4% = A(ATA)T!ATb. 
La matriz A(A7A) 147 se presenta con frecuencia en 
estadística, donde en ocasiones se le conoce como 
matriz sombrero. 


25. Las ecuaciones normales son 2 2 j| x = 6 f 
2 2||y 6 


cuya solución es el conjunto de (x, y) tal que x + y = 3. 
Las soluciones corresponden a puntos sobre la recta 
intermedia entre las rectas x + y =2 yx + y= 4. 


Sección 6.6, página 374 
l. y=.9+ 4x 3. y=1.1+1.3x 


5. Si dos puntos de datos tienen diferentes coordenadas x, 
entonces las dos columnas de la matriz de diseño X no 
pueden ser múltiplos entre sí y, por lo tanto, son linealmente 
independientes. De acuerdo con el teorema 14 de la sección 
6.5, las ecuaciones normales tienen solución única. 


1.8 1 1 
2.7 2 4 
7. a) y = XB + e€, donde y = | 3.4 |, X =]|3 9f, 
3.8 4 16 
3.9 5 25 
€ 
€2 
B= le | E= | €s 
2 é 
Le 
b) [M] y = 1.76x — .20x? 
7.9 cosl senl 
9. y = XB +€, donde y = | 5.4 |, X = | cos2 sen2 f, 
—.9 cos3 sen3 


11. [M] £ = 1.45 y e = .811; la órbita es una elipse. La ecuación 
r= B/(1 — e - cos 9) produce r = 1.33 cuando Y = 4.6. 
13. [M]a) y = —.8558 + 4.70251 + 5.55541? — .02741? 
b) La función velocidad es 
v(t) = 4.7025 + 11.11081 — .08221?, y 
v(4.5) = 53.0 ft/seg. 
15. Sugerencia: Escriba X y y como en la ecuación (1), y calcule 
XX y Xy. 


17. a) La media de los datos en xes x = 5.5. Los datos en 
forma de desviación media son (—3.5, 1), (=.5, 2), (1.5, 3) 


19. 


y (2.5, 3). Las columnas de X son ortogonales porque las 
entradas en la segunda columna suman 0. 


4 0 Bo] _ 9 
b) E altea 


Sugerencia: La ecuación tiene una agradable interpretación 
geométrica. 
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1. 


a) 3, ~v 105, 225 b) Todos los múltiplos de | I 


3. 28 5. 54/2, 3/3 7. £+ Lt 


9. a) Polinomio constante, p(t) = 5. 


11. 
13. 


15. 


17. 
19. 


21. 
27. 


b) 1? — 5 es ortogonal a po y p1; valores: 
(4, —4, —4, 4); respuesta: q(t) = HO — 5) 
2; 
Compruebe cada uno de los cuatro axiomas. Por ejemplo: 
1. (uv) = (4u)-(4v) Definición 
(Av)-(4u) Propiedad del producto 


= (v,u) Definición 


(u,cv) = (cv,u) Axioma 1 

= c(v,u) Axioma3 

= c(u,v) Axioma 1 
Sugerencia: Calcule 4 veces el lado derecho. 
(u,v) = Yavb + Vb a =2Vab, 
Ju]? = (va)? + (Vb? = a + b. Como a y b son 
no negativos, ||u|| = va + b. De forma similar, 
livi = vb + a. De acuerdo con Cauchy-Schwarz, 


2Vab < va +bẸ4b +a = a + b. Por lo que vab < 


0 23. 2/W/5 25. 1,1,312—1 





a+b 
z` 


[M] Los nuevos polinomios ortogonales son múltiplos de 
—17t + SÉ y 72 — 1551 + 3511, Escale esos polinomios para 
que sus valores en —2, —1, 0, 1 y 2 sean enteros pequeños. 
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1. 
3. 


11. 


y=2+ 31 
p(t) = 4po — -lpi — -5p2 + 2p3 
=4-—.1t — 5—2) + .2 ($p — 41) 
(Este polinomio ajusta los datos de manera exacta). 
Utilice la identidad 
sen mt sen nt = 3[cos(mt —nt) —cos(mt + nt)] 


l+c0s2kt 


Aplique la identidad cos? kt = a 


m + 2 sent + sen 2t + Z sen 31 [Sugerencia: Ahorre tiempo 
empleando los resultados del ejemplo 4]. 


11 ; z 
37 30821 ¿Por qué? 


13. Sugerencia: Tome las funciones f y g en C[O, 271], y fije 
un entero m = 0. Escriba el coeficiente de Fourier de f + g 
que implique a cos mt, y también escriba el coeficiente de 
Fourier que implique a sen mt (m > 0). 


15. [M] La curva cúbica es la gráfica de 


g(t) = —.2685 + 3.60951 + 5.85761? — .04771?. 13. 


La velocidad en 1 = 4.5 segundos es g'(4.5) = 53.4 ft/seg. 
Esto es aproximadamente .7% más rápido que la estimación 
obtenida en el ejercicio 13 de la sección 6.6. 
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1. a) F b) V c) V d) F e) F HvV 
g) V h) V i) F DV k) V D F 
m) V n) F o) E p) V q) V r) F 
s) F 


2. Sugerencia: Si {Vv1, V2} es un conjunto ortonormal y 
X = c1V1 + c2V2, entonces los vectores c1V1 y €C2V2 
son ortogonales, y 
Ixl? = llavi + evll? = levi? + llev? 

= (lall D? + (elly? = lc11? + [c21? 


(Explique por qué). Así que la igualdad establecida es válida 15. 


para p = 2. Suponga que la igualdad es verdadera para p = k, 
con k = 2, sea {v1,..., Vę&+1} un conjunto ortonormal, y con- 
sidere que X = c1V1 + + + CkVk + Ck+1Vk+1 = Uk + Ck+1Vk+1, 
donde ug = c1V1 + ° + CkKVk. 


Respuestas a los ejercicios con numeración impar A47 


ecuaciones es Ax = b, y el conjunto de todas las soluciones 
de mínimos cuadrados coincide con el conjunto de 
soluciones de ATAx = ATb (teorema 13 de la sección 6.5). 
Estudie esta ecuación, y considere el hecho de que 

(wwB)x = v(v"x) = (vixv, porque vx es un escalar. 


a) El cálculo fila-columna de Au muestra que cada fila de A 
es ortogonal a cada u en Nul A. Así, cada fila de A está en 
(Nul A)”. Como (Nul A)+ es un subespacio, debe contener 
a todas las combinaciones lineales de las filas de A; por lo 
que (Nul 4)+ contiene a Fil A. 


b) Si rango A = r, entonces dim Nul A = n — r, de acuerdo 
con el teorema del rango. Por el ejercicio 24c) de la sección 
6.3, 


dim Nul A + dim(Nul A)+ = n 


Así, dim (Nul A)+ debe ser r. Pero Fil A es un subespacio 
r-dimensional de (Nul A)+, de acuerdo con el teorema del 
rango y el inciso a). Por lo tanto, Fil A debe coincidir con 
(Nul A)+. 

c) Sustituya A por A en el inciso b) y concluya que 
Fil 47 coincide con (Nul 47)". Como Fil 47 = Col A, 
esto prueba c). 


Si A = URU” con U ortogonal, entonces A es similar a R 
(porque U es invertible y UT = U”") y así A tiene los 
mismos valores propios que R (de acuerdo con el teorema 4 
de la sección 5.2), a saber, los n números reales sobre 

la diagonal de R. 





3. A partir de x y un conjunto ortonormal {v1,..., Vp} en R”, Axl] 
sea X la proyección ortogonal de x sobre el subespacio 17. [M] ixil = 4618, 
generado por V1,..., Vp. De acuerdo con el teorema 10 Abl] 
de la sección 6.3, cond(4) x Toi = 3363 x (1.548 x 1074) = .5206. 
E= vV F eN) Observe que ||Axl||/l|x|| casi es igual a cond(A) por ||Abl|/|lbl]. 
Por el ejercicio 2, [[X]? = |x-w11? + --+ + |x+vpl?. 
La desigualdad de Bessel se deduce del hecho de que 19. [M] [Ax] =7.178 x 1073, [Abl = 2.832 x 10. 
IIRI? < [IxI1?, observado antes del enunciado de la Ixl] bl] 
desigualdad de Cauchy-Schwarz, en la sección 6.7. Observe que el cambio relativo en x es mucho más pequeño 
5. Suponga que (Ux)-(Uy) = x-y para toda x, y en R”, que el cambio relativo en b. En efecto, puesto que 
y sea €j,..., €, la base estándar para [R”. Para ¡ = 1,...,n, AD] 
Ue; es la j-ésima columna de U. Puesto que cond(A) x ibli = 23,683 x (2.832 x 107*) = 6.707 
[Uej]? = (Ue) (Ue) = eje; = 1, las columnas de U son 
vectores unitarios; puesto que (Ue;)-(Uer) = eje; = O para el límite teórico del cambio relativo en x es 6.707 (con cuatro 
j + k, las columnas son ortogonales en pares. cifras significativas). Este ejercicio muestra que aun cuando 
i 7 y el número de condición es grande, el error relativo en una 
T oS HEE E Calcule Q Q, considerando el hecho de que solución no necesita ser tan grande como se podría esperar. 
(uut)! = uttu = uu’. 
9. Sea W = Gen {u, v}. Dada z en R”, sea 2 = proywz. Entonces 
2 está en Col A, donde A = [uv], por ejemplo, Z = AX para Capítulo 7 


alguna £ en R?. Así, X es una solución de mínimos cuadrados 
de Ax = z. Las ecuaciones normales se pueden resolver para 


producir X, y después Z se determina calculando AX. 1. 
x a 1 
11. Sugerencia: Sean x = | y |,b= | b |,v= | -2 |y 7. 
Z c 5 
y! 1-2 5 
A=|v |= —2 5 |. El conjunto dado de 11. 
y! 12 5 
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Simétrica 3. No es simétrica 5. No es simétrica 


Ortogonal, | E) 9. No ortogonal 


2/3 0 5/3 
Ortogonal, | 2/3 1/45 -4/4V45 |. 


1/3 2/45 -2/v45 
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| 1/42 -1/42| ,_[4 0 
ara Los 9] 


o| 4/17 1/717 [17 0 
2 r=] TA “a l2-[ 0 o] 
1/43 1/46 -—1/v2 
17. P=| 1/43 -2/v6 o l, 
1/43 1/46 1/42 
5 0 0 
D=|0 2 0 
0 0 -2 
1/45  4/V45 -2/3 
19. | 2/45  2/445 -1/3 |, 
0 5/v45 2/3 
7 0 0 
D=|0 7 0 
0 0 -2 
5 =5 -1/42 0 ] 
la 5 0  -1/v42 
2L r-l; =5 1/42 0 1 
5 0.5 0 1/42 
9 0 0 a 
0 5 0 0 
Po o ı o0 
0 0 0 a 
1/43 -1/42 -1/46 
23. .PB= 11/43 “1/72. 1/46 15 
1/43 0 2/6 
5 0 0 
D=|0 2 0 
0 0 2 


27. (BABY) = BYATB"" Producto de transpuestas 
en orden inverso 
BYAB Porque A es simétrica 


El resultado sobre BTB es un caso especial cuando A = 7. 
(BBT)" = BTTBT = BB", por lo que BB” es simétrica. 


29. Sugerencia: Utilice una diagonalización ortogonal de A, 
o recurra al teorema 2. 


31. El teorema de diagonalización de la sección 5.3 
dice que las columnas de P son vectores propios 
(linealmente independientes) correspondientes a los 
valores propios de A listados en la diagonal de D. 
Así, P tiene exactamente k columnas de vectores propios 
correspondientes a A. Esas k columnas forman una base 
para el espacio propio. 


33. A = 8uju? + 6u7u7 + 3u3u/ 


1/2 —1/2 0 
=8|-1/2 1/2 0 
0 O 


1/6 1/6 -2/6 
+6| 1/6 1/6 -2/6 
—2/6 —2/6 4/6 


1/3 1/3 1/3 
$. Ss. 178 
1/3 1/3 1/3 


35. Sugerencia: (uu7)x = u(u7x) = (ux)u, porque u”x 
es un escalar. 
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1. a) 5x? + xix + x2 b) 185 c) 16 
10 -3 5 3/2 
3a) È E] b) E 0 | 
8 —3 2 0 2 3 
5. a)| -3 7 -l1 b)| 2 0 —4 
2 -1 -3 3-4 0 


1 i 
7. x = Py, donde P = A ¡Ds = 6y? — 4y%. 


v2L1 1 
En los ejercicios 9 a 14, son posibles otras respuestas (cambio de 


variables y nueva forma cuadrática). 


9. Positiva definida; los valores propios son 2 y 7. 


1 E 
Cambio de variable: x = Py, con P = Al l J 


WE 2 1 


Nueva forma cuadrática: 7y? + 2y3 


11. Indefinida; los valores propios son 7 y —3 
; y a  1[1 -1 
Cambio de variable: x = Py, con P = zD | 1 1 | 


Nueva forma cuadrática: 7y? — 3y2 


13. Positiva semidefinida; los valores propios son 0 y 10 


1 
Cambio de variable: x = Py, con P = zal 1 a 


vIoL-3 1 


Nueva forma cuadrática: 10y? 


15. [M] Negativa semidefinida; los valores propios son 
0, —6, —8, —12 
Cambio de variable: x = Py; 


3/ V12 0 -1/2 0 | 
1/ v12 -2/46 1/2 0 

1/42 1/46 1/2 -1/42 
1/42 1/46 1/2 1/42 


Nueva forma cuadrática: —6y3 — 8y3 — 12y% 


17. [M] Indefinida; los valores propios son 8.5 y —6.5 
Cambio de variable: x = Py; 


3-4 3 4 
115 0-5 0 
~ Jolt 3 43 


0 5 0 5 


19. 
23. 


25. 


27. 


Nueva forma cuadrática: 8.5y? + 8.5y3 — 6.5y3 — 6.5y% 


8 


Escriba el polinomio característico de dos formas: 


b 
d—À 


= 1? — (a+ d)à +ad — b? 


det(A —A1) = de E E 


y 
A=A)0 42) = 12 (A1 + 42)4 + 2142 


Iguale los coeficientes para obtener A¡ + A =a + dy 
AMA = ad — b? = det A. 


El ejercicio 27 de la sección 7.1 demostró que BTB es 
simétrica. Además, x"B"Bx = (Bx)"Bx = ||Bx||? > 0, 
así que la forma cuadrática es positiva semidefinida, 

y se dice que la matriz BB es positiva semidefinida. 
Sugerencia: Para demostrar que B7B es positiva definida 
cuando B es cuadrada e invertible, suponga que 

x"B"Bx = 0 y deduzca que x = 0. 


Sugerencia: Demuestre que A + B es simétrica y que la forma 
cuadrática x"(A+B)x es positiva definida. 
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1. 


13. 


15. 


17. 


1/3 2/3 -2/3 
x = Py, donde P = 2/3 1/3 2/3 
—2/3 2/3 1/3 
1/3 
a) 9 b) +| 2/3 c) 6 
—2/3 
—1/v2 
a) 7 Jl e c) 3 
1/3 
+| 2/3 9. 5+v5 11. 3 
2/3 


Sugerencia: Sim = M, tome a: = 0 en la fórmula para x. Es 
decir, sea x = u,, y compruebe que x7Ax = m. Sim < M y 

si t es un número entre m y M, entonces 0 < t — m S M — 
my0 = (t — m)/(M — m) = 1. Sea a = (t — m)/(M — m). 
Resuelva la expresión para a para ver que t = (1 — a)m + 
aM. Conforme e va de O a 1, £ va de m a M. Construya x como 
en el enunciado del ejercicio, y compruebe sus propiedades. 


[M] a) 7.5 b) c) —.5 


un yn in 


a 

1/42 
1/ v12 
1/ v12 


[M]a) -4 b) c) —10 
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Sección 7.4, página 423 
1. 3,1 3 32 


Las respuestas en los ejercicios 5 a 13 no son las únicas 
posibilidades. 


3 0 Al TEA o0 
Je del 0 A all | 
z. | 1/75 2/45 f a 2/45 1/75 
"12/45 1/45|L0 2]||-1/V45 2/v53 

1/42 -1/42 01][ 3/10 0 
9. 0 0 1 0 V10 

1/42 1/42 0 0 0 
sl 245 1/75 

1/45 2/45 

-1/3 2/3 2/3|11 3/10 0 
u. | 2/3 -1/3 2/3 0 0 

2/3 2/3 -1/3 0 0 
< | 3/70 —1/V10 

1/ v10  3/v10 


3 2. 2 
al 


_|yy2 -1/42|[5 0 0 
1/42 1/42 ||0 3 0 
1/42 1/72 0 
x | -1//18 1/4/18 -4/vV18 
-2/3 2/3 1/3 
15. a) rango A =2 
.40 —.78 
b) Base para Col A: 37 |, | —.33 
—.84 —.52 
.58 
Base para Nul A: | —.58 
.58 


(Recuerde que V? aparece en la DVS). 


17. SeaA = USV” = UXSV”!, Puesto que A es cuadrada 
e invertible, rango A = n, y todas las entradas en la 
diagonal de > deben ser distintas de cero. 

Así, A71=(USV"!)y!= Vu"! =Yy2"1U7, 


19. Sugerencia: Como U y V son ortogonales, 


ATA = (UEVT)TU EVT = VX"UTUYEV” 
= V(£TE)VT! 


Así, V diagonaliza ATA. ¿Qué indica esto acerca de V? 


21. SeaA = U3V”. La matriz PU es ortogonal, porque P y U 
son ortogonales. (Véase el ejercicio 29 de la sección 6.2). 
Así, la ecuación PA = (PU)2V” tiene la forma requerida 
para una descomposición en valores singulares. Según el 
ejercicio 19, las entradas diagonales en 2 son los valores 
singulares de PA. 


23. Sugerencia: Utilice la expansión columna-fila de (U3)V?. 
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25. Sugerencia: Considere la DVS para la matriz estándar de T, 
por ejemplo, A =UEVT = U2V”?. Sean B = ([vj,..., Vn} y 
C = {u;,..., Um} bases construidas de las columnas de V y U, 
respectivamente. Calcule la matriz para T respecto de B y C, 
como en la sección 5.4. Para hacer esto, se debe probar que 
V7ly; = ej, la j-ésima columna de /,,. 


=.57 =.65 -.42  .27 
.63 —.24 —.68 —.29 


21M] .07 —.63 .53 —.56 
—.51 .34 —.29 —.73 
16.46 0 0 0 0 
z 0 12.16 0 0 0 
0 0 4.87 0 0 
0 0 0 431 0 
=.10  .61 —.21 —.52  .55 
—.39 .29 .84 —.14 a 
x| —.74 —.27 —.07 .38 .49 
41 —.50 .45 —.23 .58 
—.36 —.48 —.19 —.72 —.29 


29. [M] 25.9343, 16.7554, 11.2917, 1.0785, .00037793; 
01/05 = 68,622 
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12 7 10 -6 -9 -10 8 
1 m=[ 19); 8=|> -4 -1 5 3 sal 


86 -—27 
pa E | 
.95 ¿32 
3. [57] para à = 95.2, [3 paraa = 6.8 


5. [M] (130, 874, 468), 75.9% de la varianza 
7. y = .95x1 — .32x>; y¡ explica el 93.3% de la varianza. 
9. cı = 1/3, c2 = 2/3, c3 = 2/3; la varianza de y es 9. 


11. a) Si w es el vector en RY con un 1 en cada posición, entonces 


[X She Xy ]w=X; +-+Xy=0 
porque las Xy están en la forma de desviación media. 
Entonces, 
[Y Yy]w 
= [PX P"Xy ] w Por definición 
= PT[X; Xy]w=P"0=0 


Es decir, Y ¡ + +": + Yy= 0, por lo que las Y, están 
en forma de desviación media. 


b) Sugerencia: Como las Xj están en forma de desviación 
media, la matriz de covarianza de las X; es 


T 
1/W—-D[X; Xy ][X; Xy | 
Calcule la matriz de covarianza de las Y, con base en el 


inciso a). 


13. SiB = [$ Xy l, entonces 


AT 
* | 
S = — BB" = — |$, - X]| : 
AT 
y, | 
1 A AT 


N 
1 
= ——Y XX, = —— X; —- M(X; - My” 
N-14%% roil JMX, — M) 


z 
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1. 


P 


11. 


13. 


15. 


a) V b) F c) V d) F e) F PE 
g) F h) V i) F jJ) F k) F I) F 
m) V n) F o) V p) V q) F 


Si rango A = r, entonces dim Nul A = n — r, de acuerdo 

con el teorema del rango. Así, O es un valor propio con 
multiplicidad n — r. Por lo tanto, de los n términos en la 
descomposición espectral de A, exactamente n — r son nulos. 
Los restantes r términos (correspondientes a los valores 
propios diferentes de cero) son matrices con rango 1, como se 
mencionó en el análisis de la descomposición espectral. 


Si Av = Av para alguna A diferente de cero, entonces 
v = ÀT! Av = A(M7!v), lo que muestra que v es una 
combinación lineal de las columnas de A. 


Sugerencia: Si A = RTR, donde R es invertible, entonces A 
es positiva definida, por el ejercicio 25 de la sección 7.2. 
Al contrario, suponga que A es positiva definida. Entonces 
por el ejercicio 26 de la sección 7.2, A = BTB para alguna 
matriz positiva definida B. Explique por qué B admite 

una factorización QR, y úsela para crear la factorización 
de Cholesky de A. 


Si A es de m x n y x está en R”, entonces 

xATAx = (Ax)" (Ax) = || Ax||? > 0. Así, ATA es positiva 
semidefinida. Por el ejercicio 22 de la sección 6.5, 

rango ATA = rango A. 

Sugerencia: Escriba una DVS de A en la forma 

A = UÈV" = PQ, donde P = UÈU" y Q = UV”. 
Demuestre que P es simétrica y con los mismos valores 
propios que >. Explique por qué Q es una matriz ortogonal. 


a) Sib = Ax, entonces x* = A*b = A*Ax. De acuerdo 
con el ejercicio 12a), x* es la proyección ortogonal 
de x sobre Fil A. 
b) A partir de a) y del ejercicio 12c), 
Axt = A(AĦt Ax) = (AAŤ A)x = Ax =b 
c) Como x* es la proyección ortogonal sobre Fil A, el teorema 
de Pitágoras indica que ||uļ|? = || x+ |2 + lju — x+[]?. 
El inciso c) se deduce inmediatamente. 
1 
6) 


2 -14 13 13 
2 -14 13 13 


1 
M] 4+ = -2 6 -7 -—7|,x=|-3 
2 6 71 7 8 
4-12 -—6 -6 6 


La forma escalonada reducida de | | es la misma que la 


forma escalonada reducida de A, excepto por una fila 
adicional de ceros. Así que al sumar múltiplos escalares 


de las filas de A a x” se puede obtener el vector cero, lo que 
prueba que x” está en Fil A. 
—1 
1 
Base para Nul A: 0j, 


|o 


O = = O O 
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1. 


13. 


15. 


17. 


19. 


21. 


23. 


Algunas posibles respuestas: y = 2v; — 1.5v2 + .5v3, 
y = 2v; — 2v3 + V4, y = 2v1 + 3v2 — 7v3 + 3v4 


y = —-3v1 + 2v + 2v3. Los pesos suman 1, por lo que es una 
suma afín. 


a) pı = 3b; — bz — b; e aff S porque los coeficientes 
suman 1. 

b) p2 = 2b; + 0b2 +b; ¢ aff S porque los coeficientes 
no suman 1. 

c) p3 = —b; + 2b, + 0b; e aff S ya que los coeficientes 
suman 1. 


a) pı € Gen S, pero pı g aff S 
b) p2 e Gen S, y pz € aff S 
c) p3 4 Gen S, por lo que pz £ aff S. 


v= | | y Ya = | a | Otras respuestas son posibles. 


Gen {v2 — V1, V3 — Vı} es un plano si y solo si 

{v2 — V1, V3 — V1} es linealmente independiente. Suponga 
que c2 y c3 satisfacen c2(V2 — v1) + c3(v3 — vı) = 0. 
Demuestre que esto implica c2 = c3 = 0. 


Sea S = {x : Ax = b}. Para probar que S es afín, es suficiente 

demostrar que S es un plano afín, de acuerdo con el teorema 3. 
Sea W = {x : Ax = 0}. Entonces, W es un subespacio de R”, de 
acuerdo con el teorema 2 de la sección 4.2 (o el teorema 12 

de la sección 2.8). Como S = W + p, donde p satisface 

Ap = b, de acuerdo con el teorema 6 de la sección 1.5, S 

es un traslado de W, y por lo tanto, S es un plano afín. 


Un conjunto conveniente consta de cualesquiera tres vectores 
que no sean colineales y tengan 5 en su tercer entrada. Si 5 es 
su tercera entrada, estos se encuentran en el plano z = 5. Si los 
vectores no son colineales, entonces su envoltura afín no puede 
ser una recta, así que debe ser un plano. 


Si p, q e f(S), entonces existen r, s e S tales que f(r) = p 

y f(s) = q. Dado cualquier £ e [R, debe demostrarse que 

z = (1 — ^p + tq está en f(S). Ahora utilice las definiciones 
de p y q, y considere el hecho de que fes lineal. 


Como B es afín, el teorema 1 implica que B contiene todas 
las combinaciones afines de puntos de B. Por lo tanto, B 
contiene todas las combinaciones afines de puntos de A. 
Es decir, aff A C B. 


Como A C (A U B), del ejercicio 22 se deduce que 
aff A C aff (A U B). De forma similar, aff B C aff (A U B), 
de manera que [aff A U aff B] C aff (A U B). 


25. 


Respuestas a los ejercicios con numeración impar A51 


Para demostrar que D C E N F, demuestre que D C E y 
DCF. 
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1. 
3. 


5. 
7. 


11. 


13. 


15. 


17. 


Afínmente dependiente y 2v; + v2 — 3v3 = 0. 


El conjunto tiene independencia afín. Si los puntos son 

Vi, V2, V3 y V4, entonces {V1, V2, V3} es una base para R3, 

y v4 = 16v; + 5v2- 3v3, pero los pesos en la combinación 
lineal no suman 1. 


—4vı E 5v2 = 4v3 AE 3v4 =0 
Las coordenadas baricéntricas son (—2, 4, — 1). 


Cuando un conjunto de cinco puntos se traslada restándole, 
por ejemplo, el primer punto, entonces el nuevo conjunto 

de cuatro puntos debe ser linealmente dependiente, de acuerdo 
con el teorema 8 de la sección 1.7, porque los cuatro puntos 
están en R’. Según el teorema 5, el conjunto original de 

cinco puntos es afínmente dependiente. 


Si {v1, v2} es afínmente dependiente, entonces existen 

c1 y c2, sin que ambos sean cero, tales que c1 + c2 = 0 

y Cc1V1 + c2v2= O. Demuestre que esto implica que v; = v2. 
Para lo inverso, suponga que vı = vz y seleccione c1 y c2 
específicos que muestren su dependencia afín. 


1 3 
a) Los vectores Vz — Vı = 2 y V3=V1= 3 no son 


múltiplos y entonces son linealmente independientes. 
De acuerdo con el teorema 5, $ es afínmente independiente. 


peo (07) o C-i- 
piip e (ia) 


c) pses (—, —, +), p7 es (0, +, —) y ps es (+, +, —) 


1 


Suponga que S = (b;,..., bz] es un conjunto afínmente 
independiente. Entonces, la ecuación (7) tiene una solución 
porque p está en aff S. Por lo tanto, la ecuación (8) tiene una 
solución. Según el teorema 5, las formas homogéneas de los 
puntos en S son linealmente independientes. Por lo que (8) 
tiene solución única. Entonces (7) también tiene solución 
única, porque (8) contiene ambas ecuaciones que aparecen 
en (7). 


El siguiente argumento es similar a la demostración 

del teorema 7 de la sección 4.4. Si S = ([bj,..., by) es 

un conjunto afínmente independiente, entonces existen 
escalares c;,..., ch que satisfacen (7), por definición de aff S. 
Suponga que x también tiene la representación 


x= dibi +--+ dbk y d+- +d =1 (Ta) 


para escalares d;,..., dx. Entonces, la resta produce la ecuación 


0 =x-x = (cı — dı)bı +--+ + (ck — dg )bk (1b) 


Los pesos en (7b) suman cero porque las c y las d suman 1 por 
separado. Esto es imposible, a menos que cada peso en (8) sea 
igual a 0, ya que S es un conjunto afínmente independiente. 
Esto demuestra que c; = di para i = 1,..., k. 
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19. 


21. 


23. 


Si [p1, P>, P3) es un conjunto afínmente dependiente, 
entonces existen escalares c, cz y C3, no todos cero, tales 
que c¡p¡ + c2p2 + c3P3 = 0 y c1 + c2 + c3 = O. 

Ahora utilice la linealidad de f. 


Sea a = [g v- HS [E | Entonces, 
da bz Ca2 


ai bi C1 
det[a b €¿]=det| az b c |= 
Add el 
d da 1 
det | b; b 1 |, por la propiedad del determinante de la 


Ci C3 1 


transpuesta (teorema 5 de la sección 3.2). Por el ejercicio 30 
de la sección 3.3, este determinante es igual a 2 veces el 
área del triángulo con vértices en a, b y c. 


g r 
Sila b c]|s 
t 


= p, entonces la regla de Cramer da 


r=det[p b ¿]/det[á b ¿]. Porel ejercicio 21, 
el numerador de este cociente es dos veces el área 

del Apbc, y el denominador es el doble del área del Aabc. 
Esto demuestra la fórmula para r. Las otras fórmulas se 
pueden probar empleando la regla de Cramer para s y t. 
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3. 
5. 


13. 


15. 


17. 


19. 


Ninguno está en conv S. 


A 1 2 1 
pı = Tei t 3V2 T 3V3 T ¿ Va, por lo que py £ conv $. 
P2 = 3V1 + 3V2 + ¿V3 + Va, por lo que pz e conv $. 


a) Las coordenadas baricéntricas de p1, P2, P3 y p4 Son, 


: 111 1 1) (/1_13 
respectivamente, (3, E 3), (0, T 3), (3-3, 3) y 
(1,3,-1) 
22474)" 
b) p3 y pa están fuera de conv T. pı está dentro de conv T. p2 
está en la arista V2V3 de conv T. 


pı y p3 están fuera del tetraedro conv S. p, está sobre la cara 
que contiene los vértices v2, V3 y V4. p4 está dentro de conv S. 
ps está sobre la arista entre vı y V3. 


Si p, q e f(S), entonces existen r, s e S tales que f(r) = p 
y f(s) = q. El objetivo es mostrar que el segmento de recta 
y = (1 — Öp + tq, para 0 S t S 1, está en f(S). Utilice la 
linealidad de f y la convexidad de S para demostrar que 

y = f(w) para alguna w en S. Esto probará que y está 

en f(S) y que f(S) es convexo. 


1 t 1 1 1 1 
p = gy1 +53W⁄2 + 3V4 y P = 3V1 + V2 + 3V3- 


Suponga que A C B, donde B es convexo. Entonces, como 

B es convexo, el teorema 7 implica que B contiene todas 

las combinaciones convexas de puntos de B. Por lo tanto, 

B contiene todas las combinaciones convexas de puntos de A. 
Es decir, conv A C B. 


a) Con base en el ejercicio 18, demuestre que conv A y conv 
B son subconjuntos de conv (A U B). Esto implicará que su 
unión también es un subconjunto de conv (A U B). 


b) Una posibilidad es dejar que A esté formado por dos 
esquinas adyacentes de un cuadrado, y B por las otras 
dos esquinas. Entonces, ¿qué son (conv A) U (conv B), 
y conv (A U B)? 


Pi = P2 


1» e 


Po 
23. g(1) = (1 — Hfo(t) + tf (t) 
= (1 — 10 —1)po + 1p] + ¿[0 —1)p, + 1p,] 
= (1 — t)’ Po + 2t (1 — 1)p, + 1?p,. 


21. 





La suma de los pesos en la combinación lineal para g es 
(=t)? +2t(1 — t) + t?, que es igual a 

(1 — 2t + t?) + (2t — 2t?) + 1? = 1. Cada uno de los 
pesos está entre 0 y 1 cuando 0 =£ £ <= 1, así que g(t) 
está en conv (po, Pi, P2). 


Sección 8.4, página 467 
1. f(x, x2) = 3x1 + 4x2 y d = 13. 


3. a) Abierto 
d) Cerrado 


b) Cerrado 
e) Cerrado 


c) Ni abierto ni cerrado 


5. a) No es compacto, convexo 
b) Compacto, convexo 
c) No es compacto, convexo 
d) No es compacto, no es convexo 


e) No es compacto, convexo 


7. a) n= > o un múltiplo 
3 
b) f(x) = 2x2 + 3x3, d = 11 
3 
9. a) n= o un múltiplo 
1 


b) f3) = 3x1 — x2 + 2x3 + x4, d = 5 


11. yv, está en el mismo lado que 0, vı está en el otro lado, 
y v3 está en H. 


32 10 
13. Una posibilidad es p = e Y = = , 
0 0 
—4 
1 
vV = 0 
1 


15. f(x1, X2, X3) = X1 — 3x2 + 4x3 — 2x4 yd = 5 
17. f(x1, X2, X3) = X1 — 2x2 + x3 yd = 0 
19. f(x1,x2,x3) = —5x1 + 3x2 + x3 yd =0 


23. 


25. 


27. 


29. 
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1. 


11. 


13. 
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f1, x2) = 3x1 — 2x2 con d que satisface 9 < d < 10 es una b) 

posibilidad. fo h k hB fa 
S 1 

; S? 4 4 

f(x, y) = 4x + 1. Una elección natural para d es 12.75, que es a 

igual a f(3, .75). El punto (3, .75) es 3/4 de la distancia entre S 8 12 6 

el centro B(0, 3) y el centro de B(p, 1). S4 16 32 24 8 
S5 | 32 80 80 40 10 





El ejercicio 2a) de la sección 8.3 da una posibilidad. O bien, 
sea S = {(x, y) : x?y? = 1 y y > 0}. Entonces, conv S es 
el semiplano superior (abierto). 15. 


a) fo(P")= f0)+1 
b) FAP) = ALO) + fi (Q) 


Sean x, y e B(p, 0) y suponga que z = (1 — £)x + ty, donde E 
c) faa(P") = fa—(Q)+1 


0 = 1 = 1. Después, demuestre que 


liz =pl| = [[( —1)x + ty] — pl 


19. Sean S convexo y x e cS + dS, donde c > 0 y d > 0. 
=|- Ha- p) +t -P| < ô. 


Entonces, existen s¡ y s2 en S tales que x = cs, + d8>. 
Pero entonces, 


c d 
= CS1 + ds, = d) | —— sı + —— s }. 
x= cs; + ds = (c + stas) 
a) m = 1 enel punto p; Ahora demuestre que la expresión en el lado derecho es un 
miembro de (c + d)S. 
Para el inverso, tome un punto típico en (c + d)S y 
demuestre que está en cS + dS. 


b) m = 5 en el punto p2 


c) m = 5 en el punto p3 


a) m = —3 en el punto p3 
b) m = 1 en el conjunto conv {p1, ps} 21. Sugerencia: Suponga que A y B son convexos. Sean x, 
c) m = —3 en el conjunto conv {p1, p2} y e A + B. Entonces, existen a, € e A y b, d e B tales que 


x=a+byy=c+ d. Para cualquier f tal qued=1< 1, 
demuestre que 


¡AA 
¡AA 


El origen es un punto extremo, pero no es un vértice. Explique 
por qué. 


w= (1—t)x+ ty = (1 —t)(a + b) + t(c + d) 


representa un punto en A + B. 
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1. Los puntos de control para x(1) + b deberían ser po + b, 
pı + b y p; + b. Escriba la curva de Bézier que pasa 
a través de esos puntos, y pruebe algebraicamente que 
esta curva es x(t) + b. 


3. a) X(0) = (—3 + 6t — 3t2)Pọ + (3 121 + 9?)p, + 
— (6t — 912)p, + 31?p, por lo que 
x'(0) = —3po + 3p, = 3(P, — Po) y 
x'(1) = —3p, + 3p; = 3(p; — p2). Esto demuestra que 


Una posibilidad es hacer que $ sea un cuadrado que incluya 
parte de la frontera, pero no toda. Por ejemplo, que incluya 
solamente dos aristas adyacentes. La envoltura convexa del 
perfil P es una región triangular. 


S conv P = 


a) fo(C?) =32, f(C*) = 80, f.(C*) =80, 
FC?) = 40, fu(C?) = 10, y 
32 — 80 + 80 — 40 + 10 = 2. 


el vector tangente x'(0) apunta en la dirección de po a pı 
y es tres veces la longitud de pi — Po. De igual manera, 
x'(1) apunta en la dirección de p, a p» y es tres veces la 
longitud de p3 — p». En particular, x'(1) = 0 si y solo 
si P3 = p2- 

b) x” (t) = (6 — 6t)po + (—12 + 18t)p; 

+(6 — 18£)p, + 61 py así que 

x” (0) = 6Po — 12p; + 6p, = 6(po — P1) + 6(P2 — P1) 


y 

x”(1) = 6p, — 12p, + 6p3 = 6(p, — P») + 6(p3 — Pp»). 
Para un esquema de x”(0), construya un sistema de 
coordenadas con el origen en p,, temporalmente, y etiquete 
Po como po — p1, y p2 como p2 — pı. Por último, construya 
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una recta de este nuevo origen a través de la suma de 
Po — P1 y P2 — Pi, extendiéndose un poco. Esta recta 
apunta en la dirección de x”(0). 


0=p, P2-P1 


Po- P1 wW RU 


w= (Po- P1) + P2- P1) = Ex"(0) 


5. a) Del ejercicio 3a) o de la ecuación (9) en el libro, 
x'(1) = 3(p3 — p2) 


Utilice la fórmula para x'(0), con los puntos de control 13 
de y(t), y obtenga 


y'(0) = 3p3 + 3p4 = 3(pa — pz) 


Para continuidad C!, 3(p3 — p2) = 3(p4 — p3), de manera 
que p3 = (p4 + p2)/2, y p3 es el punto medio del segmento 


de recta de p2 a p4. 15. 


b) Six'(1) = y'(0) = 0, entonces p2 = p3 y p3 = p4. 
Así, el “segmento de recta” de p2 a p4 es justamente el 
punto p3. [Nota: En este caso, la curva combinada sigue 
siendo continua C!, por definición. Sin embargo, algunas 
elecciones de los otros puntos de “control”, Po, P1, P5 Y P6» 
pueden producir una curva con una esquina visible en p3; 
en tal caso la curva no es continua G! en p3]. 


7. Sugerencia: Utilice x”(t) del ejercicio 3 y adapte esto para 
la segunda curva para ver que 


y”) = 61 — £)p, + 62 + 3t)p4 + 6(1 — 3£)p, + 6tps 17. 


Entonces, sea x”(1) = y”(0). Como la curva es continua 
C! en ps, el ejercicio 5a) indica que el punto pz es el 
punto medio del segmento de p» a pa. Esto implica que 
P4 — P3 = p3 — po». Utilice esta sustitución para probar 
que pa y ps están unívocamente determinados por pi, P2 
y ps. Solamente pe se puede seleccionar arbitrariamente. 


9. Escriba un vector de los pesos polinomiales para x(t), expanda 
los polinomios de pesos, y factorice el vector como Mgu(?): 


41 — 121? + 1213 — 414 


ae ana 
61? — 121% + 61* | 


4t? — 4tt 


II 
ocooor 
o 
eN 
| 
= 
N 


Mpg = 


ocooo- 
o 
Rm 
| 
= 
N 
Dm 


. a) Sugerencia: Aplique el hecho de que quo = Po. 


b) Multiplique la primera y la última partes de la 
ecuación (13) por E y despeje 8q». 

c) Utilice la ecuación (8) para sustituir 8q3 y después 
aplique el inciso a). 


a) De la ecuación (11), y'(1) = .5x'(0.5) = z'(0). 
b) Observe que y'(1) = 3(q3 — q»). Esto se deduce de la 
ecuación (9), con y(t) y sus puntos de control en lugar 
de x(1) y los puntos de control de esta. De forma similar, 
para z(£) y sus puntos de control, z'(0) = 3(r, — ro). 
Por el inciso a), 3(q3 — q2) = 3(r, — ro). Remplace ro por 
qs, y obtenga q3 — q2 = rı — qa, así que qa =(q2 + r1)/2. 
c) Sean qo = po y r3 = ps. Calcule qu = (Po + p1)/2 y 
r2 = (p2 + p3)/2. Calcule m = (pı + p2)/2. 
Calcule q2 = (qı + m)/2 y rı = (m + r2)/2. Calcule 
q3 = (q2 + r1)/2 y sea ro = qs. 
Po + 2P; din 2p, + Pp» 
3 i 3 : 
b) Sugerencia: Escriba la fórmula estándar (7) en esta sección, 
con r; en vez de p; para i = 0,..., 3, y después remplace 
Yo Yy r3 por po Y p2, respectivamente: 


x(t) = (1 — 3t + 3t — t°)Po 
+ (31 — 6? + 36)ri (iii) 
+ (3 — 315)r, + Pp, 


a) ro = Po Yi = r; = p, 


Aplique las fórmulas para rı y rz del inciso a) para examinar 
el segundo y tercer términos en esta expresión para x(t). 
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cálculo alternativo, 364-366 
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realización mínima, 129 

general lineal, 371 

matemático, 1, 80-85 
aeronave, 91, 138 
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determinantes, 169-170, 174, 275 
elementales, 6, 106 
existencia/unicidad, 20-21 
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408-414 
conjunto factible, 412 
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370 
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regresión múltiple, 372-373 
residuos, 369 
suma de cuadrados para el término de 
error, 375, 383-384 
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249 
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246-249 
filtro lineal, 246 
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cruz, 464 
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elementales, 106, 174 
inversas, 105 
transpuestas, 99-100 
de números complejos, A7 
escalar, 101 
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en P”, 377 
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propiedades, 331 
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punto, 330 
Programa de matrices, 23 
Programación lineal, 2 
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Promedio móvil, 252 
Pronóstico, valor y, 369 
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39-40 
multiplicativa de det, 173, 275 
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rango, 263 
transformación lineal, 65-66, 76 
transpuesta, 99-100 
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invertible 
Proyección 
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matriz de, 398, 400 
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interpretación geométrica, 341, 
349 
matriz, 351, 398, 400 
propiedades de la, 350-352 
sobre un subespacio, 340, 347-348 
suma de, 341, 349 (fig.) 
transformación(es) de, 65, 75, 161 
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combinaciones afines de, 437-439, 
441-442 
de control, en las curvas de Bézier, 460, 
481, 482, 488-489 
espiral, 317 
extremo, 470-473 
frontera, 465 
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algoritmo, 279, 280, 324 
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estimación del, 417n 
factorización, 130, 263-264 
reveladora de, 432 
propiedades del, 263 
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Realización mínima, 129 
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de regresión, 369 
degenerada, 69, 439 
descripción explícita de, 463 
descripciones geométricas de, 440 
ecuación de, 2, 45 
implícita de, 461 
vectorial paramétrica, 44 
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traslación de, 45 
Red(es), 52-53 
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a ecuación de primer orden, 250 
por filas, algoritmo, 15-17 
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múltiple, 372-373 
ortogonal, 432 
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Repulsor, 304, 314 
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Resistencia, 82 
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Restricción presupuestaria, 412-413 
Riemann, suma de, 381 
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base estándar, 209, 342 
cambio de base, 241-242 
dimensión, 226 
forma cuadrática, 401 
longitud (norma), 331-332 
producto interno, 330-331 
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Ruido aleatorio, 252 


S 
S, 191, 244, 245-246 
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Schur 
complemento de, 122 
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dirigido, 25 
Segundo componente principal, 427 
Semejanza, transformación de, 277 
Señal(es) 
de tiempos discretos. Véase Señales 
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función, 189-190 
muestreo de, 191, 244 
ruido, 252 
sistema de control, 189, 190 
tiempo discreto, 191-192, 244-245 
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ecuación matricial, 36 
de control, 122, 189-190, 264, 301 
complemento de Schur, 122 
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función de transferencia, 122 
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modelo del espacio de estados, 
264 
par controlable, 264 
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transbordador espacial, 189-190 
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de referencia celeste internacional, 
448n 
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dinámico(s), 265-266 
atractor, 304, 314 
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desacoplado, 312, 315 
discreto(s), 301-311 
evolución de, 301 
modelo de matriz por etapas, 265-266, 
307-309 
modelo de población de búhos, 
265-266, 307-309 
modelo depredador-presa, 302-303 
no lineal, 304n 
punto espiral, 317 
punto silla, 304, 305 (fig.), 314 
repulsor, 304, 314 
soluciones gráficas, 303-305 
valores propios y vectores propios, 
266-273, 278-279, 301-311 
homogéneo, 43-44 
ecuaciones en diferencias, 246 
en economía, 49-51 
subespacio, 148, 199 
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ecuación matricial y, 34-36 
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notación matricial, 4 
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de Ax = b, 441 
descripción explícita de, 18, 44, 271 
ecuaciones diferenciales, 312 
ecuaciones en diferencias, 248-249, 271 
espacio nulo, 199 
fundamental, 249, 312 
general, 18, 43, 44-45, 249-250, 302-303, 
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paramétrica, 19-20, 44, 46 
sistema homogéneo, 43, 148, 247-248 
sistema no homogéneo, 44-46, 249-250 
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trivial y no trivial, 43 
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superficies de, 488-489 


Subespacio(s), 146-153, 193, 248 
base para, 148-150, 209 
cero, 147, 193 
dimensión de, 155-156, 226-227 
espacio 
columna, 147-148, 201 
nulo, 147-148, 199 
fundamental(es), 234 (fig.), 237, 
335 (fig.), 420-421 
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intersección de, 197, 456 
propio, 268 
sistema homogéneo, 200 
suma, 197 
transformación lineal, 204 (fig.) 
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Algebra lineal y sus aplicaciones ofrece una introducción elemental 
moderna al álgebra lineal y una amplia selección de aplicaciones a la ingeniería, ciencias de 
la computación, matemáticas, física, biología, economía y estadística. 


El texto proporciona un importante apoyo tanto para la enseñanza como para el uso de la 
tecnología en el curso mediante ejemplos, ejercicios y proyectos que proponen el uso de 
programas como MATLAB® y Maple™, así como de calculadoras programables con capacidad 
matricial. La obra ofrece nuevos contenidos tanto en el libro como en línea: 


E Más del 25 por ciento de los ejercicios son nuevos o se han actualizado, en especial los 
ejercicios computacionales. 


El 25 por ciento de los ejemplos introductorios de capítulo son nuevos. 


El nuevo capítulo La geometría de los espacios vectoriales ofrece un tema atractivo que 
los alumnos disfrutan. 


Algunas de las características distintivas de esta edición son la introducción temprana 
a los conceptos clave; una visión moderna de la multiplicación de matrices; el fuerte 
énfasis geométrico; el tratamiento más completo de la ortogonalidad y los mínimos 
cuadrados; un gran número de ejercicios que se centran en el razonamiento en lugar 
de los cálculos mecánicos, y 300 preguntas de verdadero/falso. 


Este libro incluye un código de acceso a MathXL®. Para que los estudiantes puedan 
utilizar el código se requiere que el profesor abra un curso. 
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